Brew #17: NVIDIA rośnie w siłę. Gemini, czyli "aferki się zdarzają". Sora - przyjaciel i wróg
Więc jak dla mnie to jest właśnie dramatyczne zagrożenie dla prawdy.
Prawdopodobnie będzie jedną z największych firm, znaczy może być jedną z największych firm na świecie.
Takie marginy to jest tak płakany kąsek, że po prostu nie ma haka.
Wyobraźcie sobie, że Nvidia się dogaduje z Microsoftem.
Bias to jest jedno, a my mamy swój światopogląd i my chcemy go wtłoczyć w ten model i w odpowiedzi tego modelu.
To jest takie... uch...
Dzień dobry.
Nie wiem, czy widzieliście, wiosna wróciła.
Hura, w końcu.
Chyba zima już odpuściła jakiś czas temu.
Nie wiem, ale ja wczoraj, czyli to była niedziela, nagrałem w poniedziałek For The Record.
Przyznam szczerze, że po prostu jak głupi usiadłem z kawą na tarasie i siedziałem w słońcu i po prostu ładowałem salarki.
Tak pamiętam, był to najładniejszy weekend tego roku dotychczas.
To fakt.
To fakt.
Ja nawet sprawdziłem, przyznam szczerze, na swoim, mam tam jakieś panele czy coś.
Od początku roku 2024 w Warszawie było 6 dni słonecznych.
Więc doceniamy, nie wiem jak w Krakowie.
Dzień dobry.
Kolejny brew.
Sebastian Wojtek Tomek, dokładnie zmieniony.
Formuła ewoluuje, wydarzenie na świecie zmienione, więc będą nowości.
Zaczynamy jak tradycyjnie, bo nam dobrze się o tym rozmawia, co kto znalazł, co kto przeczytał, co kto obejrzał.
Diuna dopiero wyjdzie, więc nie obejrzałem jeszcze.
Sebastian, co tam masz w kolejce?
U mnie jest szybki przemiał.
Zazwyczaj się rzucam od razu, jak coś wyjdzie.
Nie inaczej było w tym przypadku, więc opowiem trochę o książce, którą udało mi się przeczytać w zeszłym tygodniu.
Extremely Hardcore, napisana przez Zoe Schiffer.
Już po samym tytule można się zorientować, że to chyba ma coś wspólnego z Twitterem, bo Extremely Hardcore to chyba było to hasło, którym Elon Musk swoje zmiany przy przejęciu Twittera anonsował.
I to jest właśnie o tym książka, dokładnie o tym książka.
W ogóle kim jest Zoe Schiffer, tak w skrócie?
Bo to jest redaktor, jest platformera dosyć znanego portalu, który zajmuje się m.in. właśnie nowoczesnymi technologiami.
I tam Zoe Schiffer zajmowała się właśnie, zajmuje się przez cały czas przede wszystkim Twitterem, Xcorpem i wszystkim dookoła Elona Muska, czyli generalnie kobieta jest w temacie.
Książka jest krótka, książka jest konkretna.
Bardzo mi się podoba sposób, w jaki jest napisana, bo są bardzo krótkie rozdzialiki, w których jest bardzo dużo mięsa.
Czy, w którą stronę jest zbiasowana?
Ja bym powiedział tak, ton jest bardzo bezemocjonalny, czyli nie ma oceny, natomiast bias mimo wszystko widać, że jest krytyczny.
Nie da się, jeżeli ktoś jest jakimś totalnym apologetą Muska albo jego wyznawcą, to myślę, że kilka razy przełknie pigułę.
To, co jest jeszcze dodatkowo ciekawe, to jest to, że mimo tego, że Schiffer ma tam sporo kontaktów i faktycznie jest dużo wywiadów z ludźmi, którzy w jakiś sposób zostali dotknięci, ale nikt nie zgodził się z tych najbliższych, powiedzmy o nazwach goons, z tych najbliższych poruczników Muska, nikt nie zgodził się rozmawiać.
Mimo wszystko ja byłem troszeczkę rozczarowany tym, że nie było aż tak wiele takich rzeczywiście inside stories, rzeczy, które wcześniej nie wyciekły publicznie.
Ja może nie jestem jakimś wielkim fanbojem, ale śledziłem w jakimś sensie tą całą historię od momentu ogłoszenia, zainteresowania Muska, przejęcia Twittera, no i później to, co się działo, czyli właśnie kolejne fazy zwolnień, kolejne wyciekające emocjonalnie komunikaty.
Nie ma w tej książce aż tak wiele nowych rzeczy, nie ma w tej książce aż tak wiele rzeczy, które mnie interesowały, ale może właśnie ja byłem troszeczkę bardziej zainteresowany tym niż średnia.
Polecam.
U mnie to jest takie 4 na 5 gwiazdek.
Chyba największą wadą, oprócz tego, co powiedziałem odnośnie tego, że właśnie jest niewiele nowych stories, to jest to, że no ta historia jest jeszcze nie zakończona.
Czyli Twitter to są ciągle, czy ex, to są ciągle ambitne plany.
Musk ciągle hintuje, nowe funkcjonalności, które się mają pojawić, o czym on zawsze hintuje.
I zawsze obiecuje i nigdy nie dotrzymuje tych terminów, okej, nieważne.
W każdym razie ja myślę, że tę historię będziemy mogli oceniać dopiero z perspektywy par ładnych lat.
Więc może troszeczkę za wcześnie na książkę, no ale historia niebanalna, jeżeli kogoś takie dramy interesują.
Mam do Ciebie takie pytanie, że jak czytasz tę książkę, czy widzisz faktycznie to, o czym już kiedyś rozmawialiśmy, że to, co się stało w Twitterze, faktycznie ma wpływ na rynek pracy, jeżeli chodzi o szeroko pojęte IT i product engineering?
Wiesz co, on o tym nie pisze.
Nie, tam jest to wszystko, tak powiedziałbym, laser shop skoncentrowany na tym, co się tam działo.
Natomiast ona też nie ocenia te zmiany typu właśnie zwolniętki ilości ludzi albo powiedziałbym ta zmiana kulturowa, która jest stawiana priorytetowo powyżej wszystkich innych.
Ona nie stara się szukać na przykład jak są jakieś pozytywy czy nie, pod tym względem nie ocenia.
Jednak patrzy bardziej luddystycznie, czyli no, że ludzie byli w szoku, że jest trauma, że ludzie się tego nie spodziewali, że ludzie żałują, płaczą, bo brakuje im tam tej kultury, która była.
Że niektórzy wskoczyli na pociąg z pełni entuzjazmu.
No właśnie, no właśnie, więc tu tego nie ma, nie ma tego aspektu zupełnie.
I to też trochę zubaża książkę, więc w sumie dobre pytanie.
Wiesz co, ja siądę trochę, nadepnę ci na recenzję, ja wrzucę ją na Głodroicy, u mnie dostanie trzy na pięć max.
Ten bajas, ten bajas to widać na początku tej książki, bo ja też przeczytałem, przyznaję.
I na początku tej książki po prostu słuchasz i od razu wiesz, że pani Zoe nie lubi Elona.
Albo inaczej, krytycznie ocenia zmiany na X. Ale okej, to jest mój odbiór.
Największa wada tej książki jest faktycznie taka, że to jest streszczenie tego, co się działo na Twitterze.
Czyli generalnie tam nie ma tego, co byś oczekiwał, że ona coś wie ekstra.
W tej całej historii ludzi, i to jest ciekawe, takich tam pojedynczych ludzi, jak ktoś czy ten, jest kilka rzeczy, o których nie ma publicznie w internecie dużo.
Czyli na przykład, że tam cały czas idą w tle procesy.
I to nie jeden, ale chyba ich jest tam dużo, dużo tych procesów, które głównie idą o kasę, która nie została im wypłacona i różnego typu rzeczy.
Więc ja spodziewałem się więcej, przyznam szczerze.
Już ją przeczytałem, spodziewałem się więcej.
No jak ktoś tego nie śledził, to faktycznie jest to jakaś tam drama.
Jedno co, to nawet na tym etapie, na jej miejscu, pokusiłbym się o podsumowanie jakiegoś stylu wykonania tego, albo jakichś tam działań, nie?
Bo ta książka się tak w końcu urywa i nie ma nic, nie?
Nie ma ani lessons learned z tego, ani nic takiego, nie?
Więc okej.
Powiedziałbym nawet, że czasami to jest takie przekłamanie lekkie.
Czyli na przykład mówi o tym, jak wyglądały zmiany, jeżeli chodzi o advertizerów, ale nie mówi, jak wyglądały zmiany, jeżeli chodzi o ilość użytkowników, jak wyglądały sobie aplikacje i tak dalej.
Pojawia się tam, pojawiają się statystyki, podaje tam, że tyle spadło, tyle spadło i tak dalej.
To co pojawiło się publicznie.
Wojtek.
Ja troszeczkę inaczej.
Jeżeli mówimy tutaj o zaskoczeniach i ciekawostkach, to chyba jednak zostanę przy NVIDII i wynikach finansowych.
Historyczna rzecz się wydarzyła, bo po ogłoszeniu wyników NVIDIA przebiła ekskluzywny klub teraz trzech firm, które osiągnęły kapitalizację powyżej dwóch bilionów dolarów, czyli two trillion, tak?
Jak sobie sprawdzałem, to w ciągu roku od dwustu, mniej więcej dwudziestu dolarów akcje urosły do ponad ośmiuset.
I ciekaw jestem waszej perspektywy, natomiast jak czytałem sobie też dodatkowe analizy, to mniej więcej jeszcze wszyscy przewidują, że biorąc pod uwagę wszystkie wskaźniki, które wiemy na temat firmy, ona może spokojnie urosnąć minimum około 30%, w optymistycznym scenariuszu jeszcze 45-50%, co oznacza, że prawdopodobnie będzie jedną z największych firm, znaczy może być jedną z największych firm na świecie, tak?
Więc taka ciekawostka.
Opłaca się robić, słuchajcie, zacząć historię od kart graficznych.
Od gamingu.
Od gamingu, dokładnie.
I trwać przy niektórych rozwiązaniach i budować je coraz lepiej, no i wejść oczywiście w AI.
I jestem ciekaw waszej perspektywy.
Historia dzieje się na naszych oczach.
Znaczy ustawmy w perspektywie, bo to nawet w życiu jest wokół taki wykres, zakleimy go, Nvidia jest warta więcej niż GDP Rosji.
Między innymi, tak.
Między innymi, bo to tam wielu krajów, ale między innymi.
Nvidia jest warta więcej niż cały Amazon, nie AWS, cały Amazon, niż cały Google.
I Nvidia jest warta więcej niż cała giełda niemiecka DAX.
Tak.
A to jest jeszcze pikuś przy tym, że Nvidia robi tam chyba 40% net margin na tych kartach w tej chwili.
Dokładnie o to chodzi, że jeszcze spokojnie biorąc pod uwagę na jakich, jeżeli weźmiemy pod uwagę klasyczne wskaźniki, no to możemy spokojnie przewidzieć, że przebijemy ponad 1000, 1100 dolarów za akcję, co oznacza właśnie 40% więcej niż teraz.
Znaczy to pokazuje, to jest w ogóle ciekawe, nie, bo ja zaprzyjaźnionym, jak zaprzyjaźnionym przez jednego z prowadzących RumblePod polecam, Andrzej Lipka i reszta, tam był, oni zaczęli ciekawy wątek na temat CEO Nvidia, nie, bo to jest facet, który prowadzi tę firmę 30 lat.
Przez ups, downs, ups, downs i tak dalej, nie.
Tam podali ciekawy fakt, którego ja nie wiedziałem, że on ma tylko 2,3% akcji.
Tylko z...
Wiesz, jeżeli prowadzisz firmę 30 lat, to też pokazuje ile musiał oddać, żeby ją utrzymać, wziąć finansowanie i tak dalej.
Tak, tak, ten sam kłamstw.
Tak, ciekawa osoba, wchodzi w swojej skórzanej kurteczce i ten, nie.
Ja nie wiem gdzie to pójdzie, to było tylko, jest jedno ryzyko z tym związane, bo jak było ogłoszenie wyników Nvidii, ja trochę jestem na rynku finansowym publicznym, to krótko mówiąc, to było żyć albo nie żyć dla indeksów wszystkich giełdowych, bo gdyby Nvidia walnęła te wyniki, to po prostu wszystko by poszło w dół i to jest, to jest ciekawe, nie.
Taka ciekawostka, na ile, nie wiem na ile śledzicie, tam jest to Magnificent 7, czyli de facto cały wzrost z zeszłego roku na giełdach zgenerowało 7 firm technicznych, nie.
Jeżeli się wyjmie te 7 firm, to się okazuje, że indeks w ogóle był flat albo tam nawet lekko w dół, coś koło tego, więc nie wiem.
No ale opłaca się robić łopaty i ja jestem pociekaw jednego.
Wszyscy się o to pytają, to znaczy takie marginy, to jest tak płakany kąsek, że po prostu nie ma haka.
Ktoś będzie chciał zarobić te pieniądze.
Ale już są, mówię, lat, ale to bariera wejścia jest po prostu bardzo duża.
Tak, tak, ale wiesz, no mamy jednak AMD, mamy innych, nie.
Mamy firmy, które chociażby konkurują, tak, także zarówno chińskie, tajwańskie, jak i amerykańskie.
Zaznaczmy tylko jeszcze jeden fakt, przy tym w zeszłym tygodniu pojawił się tam taki produkt Grogu, chyba o ile pamiętam.
Glocku.
Tak, i tam chłopaki powiedzieli, bo to jest taki LLM, który szybko odpowiada i oni powiedzieli, tak, że to działa tak szybko, dlatego że my mamy inny chip, nie lecimy na GPU, lecimy na LPU, nie.
Nie widziałem nic więcej w tym temacie, więc nie wiem.
A ja widziałem...
Co się działo?
Widziałem wywiadu Samata, ale szczerze mówiąc to, co on tam opowiadał tutaj, czysty marketing.
Ja chętnie zakończę, że wiecie, był ten...
Teraz kończę z takim mem po internecie, że jesteś stary, jeżeli będziesz pamiętał, że w fangu N oznaczało Netflixa, a nie Nvidia.
Nie, to dobre, dobre.
Jeśli chodzi o gaming, to ja sobie pograłem w Sniper Elite 5 ten weekend, daję radę.
Jak ktoś grał z starego Commandosa, to polecam, ten sam klimat.
Dobrze, to ja szybko...
Chyba Sebastian wspominał tę książkę, ja ją wzięłem na tapetę, czytałem ją ręcznie, czyli na Kindle'u, czyli poświęcałem jej trochę więcej czasu specjalnie.
What's Our Problem?
A Self-Help Book for Societies by Tim Urban.
No i powiem tak, pozycja obowiązkowa według mnie dla ludzi, właśnie jedna tylko uwaga w formie takiej jakiejś tam drukowanej Kindle czy coś, bo w książce jest dużo obrazków, te obrazki robią robotę.
O czym jest ta książka?
Ta książka jest o tym, jak się dzielimy, jeżeli chodzi o nasze idee, jakie procesujemy, no i jak to wpływa, znaczy gdzie jesteśmy z nimi, jak działa, jak się dzielimy na tych, którzy mają argumenty, którzy nie mają argumentów, jak ten... i takich populistów i tak dalej, jak to wpływa na dyskurs publiczny.
No i potem leci przez przykładowy podział, który jest w tej chwili w Stanach, czyli jak się Stany podzieliły jako społeczeństwo.
No i jest to ciekawe, znaczy jest to nawet eye-opening, bym powiedział w niektórych miejscach.
Dzieliłem się wcześniej przed nagraniem, tam są dwie części o tym, jak republikanie poszli bardziej na prawo, bo to było dla mnie ciekawsze, potem jest jak lewo poszło bardziej na lewo, to było dla mnie trochę za długie, ale dalej ciekawe, więc ciekawy wniosek jest na końcu, bo ta książka kończy się tym, że po prostu bądź poinformowany, miej swoją opinię, jak ją masz, to nie bój się jej wyrażać.
Tam w takim trzech krokach trochę, jak robić to ostrożnie, taki typowo amerykański pod tytułem, zacznij może między znajomymi, trochę może bardziej publicznie, ale krótko mówiąc, jak myślisz, że coś jest bullshit, to po prostu call it bullshit, nie?
Więc jak dla mnie to przynajmniej w tym roku pozycja obowiązkowa do przeczytania dla każdego.
Tak, ja się całkowicie zgadzam, tam jest bardzo fajny mental model, który jest wytłumaczony na początku tej książki, który po prostu mówi o tym, że to nie tak, że lewi są źli albo prawi są źli, nie, nie, nie.
Tu można być lewym albo prawym, ale jeszcze lewym albo prawym można być w górę albo w dół.
Bardzo fajny mental model.
Tak, to jest góra-dół i krótko mówiąc, niestety smutny wniosek z tej książki i z tego, co obserwujemy, jest taki, że ekstrema biorą górę w tej chwili.
Co płynnym krokiem przynosi nas do świata technologii?
W zeszłym tygodniu, no właśnie, Sebastian, możesz powiedzieć, co w zeszłym tygodniu się wydarzyło?
Świat żyje, ciągle żyje, bo jeszcze była oferka tej ostatniej nocy, premierą, kolejną premierą, bo ileż to już miało premier?
Gemini od Google'a i pojawiło się w internecie bardzo dużo screenshotów, jak to ludzie zaczynają testować Gemini, a część z tych screenshotów dotyczyła możliwości generowania obrazów na podstawie promptów i okazało się, że modele Gemini mają bardzo ciekawą, ciekawe inklinacje, nazwijmy to polityczno-światopoglądowe, dlatego że na przykład, teraz będę mówił o tych screenshotach, które tam najchyba są najbardziej popularne, ojcowie założyciele Stanów Zjednoczonych mają zaskakująco ciemne odcięcie skóry na wygenerowanych obrazkach.
Na pytanie, czy George Washington był biały, dostajemy odpowiedź, że no, sporo wskazuje, że niekoniecznie, co chyba nie do końca jest zgodne z tym, co znajdziemy w podeczkach historycznych.
Bardzo ciekawe obrazy można uzyskać pytając, jak wyglądał rzymski cesarz, bo zdarzają się tam również kobiety o dalekowschodnich rysach albo indianie w pióropuszach, nie wiem, co pan wie tam.
No właśnie, o tych indianie.
Niemieccy żołnierze z 43. roku, co brzmi bardzo neutralnie, ale chyba wszyscy pamiętają, co się działo w 1943.
To też są czasami dalekowschodnie kobiety albo czarnoskórzy mężczyźni.
Pytając o papieży, też można dostać osoby o różnym odcieniu skóry, co może, nie wiem, nie byłoby aż tak bulwersujące, ale zdarzają się też kobiety w tych wygenerowanych obrazach.
A tu wydaje mi się, że do pewna kościoła katolickiego jest dosyć sztywna w tym temacie.
Kiedy zapytamy na przykład, zadamy takie pytanie, powiedz mi, czy mogę być dumny z bycia i teraz w kilku wariantach, białym, czarnym, azjatą, o hiszpańskich korzeniach, widać zaskakującą dysproporcję w tych komentarzach, które dostajemy.
I cóż, ostatnia tam chyba jakaś afera, która była, która się pojawiła, a właśnie, to chyba z wczoraj, to było pytanie, kto uczynił więcej zła na świecie?
Czy Elon Musk wklejający swoje memy, czy Adolf Hitler?
No i na to odpowiedź jest, że tu ciężko jednoznaczną konkluzję, bo no tak, może właśnie, panowie, pewnie też to widzieliście, jakie są wasze opinie na ten temat, czy jakieś macie?
Znaczy tak, nie, no ja opinie zawsze mam, to już się wszyscy nauczyli, nie?
Jeżeli chodzi o obrazy, to jeszcze jest okej, bo można powiedzieć, to nie oddaje rzeczywistości itd., itd., ale jak już tam zaczynamy o te fakty się pytać, no to właśnie, coś poszło źle.
Ja szczerze to trochę rozszerzę temat, nie, bo ja po prostu popatrzyłem na to i sobie zadałem kolejne pytanie, Google, co z tobą jest nie tak?
Bo tam jeszcze jest taki mały hint, który pojawił się trochę obok, nie?
Thomas Kurian, który podobno tam na poziomie PP gdzieś tam w tym Google siedzi, nie?
Napisał taki tweet, nie?
Tak, znaczy on jest tam ten od Enterprise.
Ja zacytuję ten tweet.
We are introducing a new offering called Gemin AI Business, which lets organizations use generative AI in workspaces at a lower price point than GME Enterprises, which replaces do-it AI for workspaces enterprises.
Nie?
I to pokazuje, że po prostu ta firma gdzieś się zgubiła.
Tutaj to jest o tyle ciekawe, że to jest właśnie łączy się z tym what's our problem, bo nie da się tego odnazwać chyba inaczej niż to, że Google celowo postanowiło, że ich model będzie biased.
Nie wiem jak go trenowali, nie wiem jakie były decyzje, ale można być biased z różnej strony, ale tutaj po prostu widać, że ktoś postanowił upewnić się, że kolejny raz...
I okej, można też to tak uzasadnić, że kolejny raz nikt nie pokaże im, że ich model nazywa kogoś na przykład małpą czy coś takiego, nie?
Tylko poszło to po prostu w totalnie złą stronę.
Więc tu są dwa problemy.
Jeden, jak Google jako taka firma z DeepMind, tymi zasobami i tak dalej, pozwoliło sobie na takie coś w momencie, kiedy mieli już dwie czy trzy wtopy w międzyczasie w obszarze LLM-ów, nie?
Chyba to zrobię kropkę.
Znaczy to pociągnę jeszcze, bo dam wam skomentować.
Po drugie jest, to pokazuje jakie zagrożenie jest w tych całych LLM-ach, nie?
Czyli ktoś je wytrenuje w taki sposób, jak chce, to one będą zwracały to, co chce.
I teraz to samo może zrobić Elon, to samo może zrobić Microsoft i tak dalej.
Teraz jeżeli to będzie nasz główny interfejs dostępu do wiedzy, a na to się szykuje w jakimś tam czasie, nie?
To to pokazuje dokładnie zagrożenie za tym, że jakaś ideologia, jedna lub druga, wpływa na takie LLM.
Dobrze, zrobię kropkę.
To ja tutaj, tak, ja przyznam szczerze, korzystałem i specjalnie przygotowując się do naszego odcinka, opłaciłem i stwierdziłem, że to staje nawet słynne...
Przede wszystkim lubię sprawdzać sobie źródło, słuchajcie, jeżeli jest burza wokół czegoś, to chcę to sprawdzić, tak?
Więc faktycznie dokładnie te same zapytania wrzuciłem zarówno do ChartGPT, jak i do Gemini i Gemini faktycznie ma problem.
Znaczy w sensie nie jest to, przynajmniej na tym moim koncie, nie jest to aż tak ekstremalne jak na tych screenshotach, ale faktycznie jest zbajasowane.
Teraz tutaj chciałem podkreślić jedną rzecz.
To Gemini jest zbajasowane jako produkt, niekoniecznie model.
I to jest bardzo istotne, bo teraz może warto cofnąć się o krok wstecz.
Gemini jest tak naprawdę odpowiedzią DeepMind na OpenAI GPT, tak?
Więc mamy tam kilka modeli, od Gemini Nano, które ma być w naszych telefonach, po Gemini Ultra, które jest tak naprawdę w tym momencie pierwszy rollout, można by powiedzieć, więc nie wszyscy mają do niego jeszcze dostęp.
No i oczywiście to jest dosyć mocny model.
To też warto podpowiedzieć, że na pewno jeżeli chodzi o te wszystkie testy, które posiadamy, jeżeli chodzi o np. wykonywanie zadań takich jak np. ludzkich, no to np. bije GPT na głowę w wielu testach, tak przynajmniej Google twierdzi.
Na pewno to, co jest ciekawe, że ma bardzo długi, bardzo długie możliwości, tam chyba prawie milion tokenów jest na wejściu.
Milion tokenów w kontekście Windows, tak.
Do Ultry ogromną dokumentację, bazę wiedzy i on sobie to będzie potrafił zinterpretować i będzie mógł na tym działać.
Więc to, co bym chciał, dlaczego o tym mówię.
Model to jest jedno.
I ten model, istnieje spora szansa, że on nie był zbajasowany, bo model uczymy na pewnym korpusie wiedzy.
I korpusu wiedzy, na którym został wykształcony, znaczy, który widzimy w efektach działania Gemini, po prostu nie ma.
Więc ja myślę, że tutaj, tu jest ta duża rzecz, tu jest ten duży problem, bo jeżeli właśnie jako ludzie będziemy patrzeć, okej, to to jest, wiecie, prawda objawiona, bo sztuczna inteligencja została wykształcona na jakimś korpusie naszej wiedzy, to właśnie tu się pojawia pewien problem, bo tej wiedzy nie było.
Czyli tak naprawdę tutaj mamy do czynienia nie ze zbajasowanym modelem, tylko z takim, jakby to powiedzieć dobrze, z takim hakowaniem tego modelu, żeby on nam podawał pewnego rodzaju wiedzę, która jest dla nas, mieści się w naszym jakimś tam sposobie patrzenia na świat, tak?
Więc tutaj według mnie jest ten kłopot, że wzięto ogrom pracy, naprawdę porządny model i ktoś stwierdził, to ja sobie teraz wrzucę na to dodatkowy framework, który spowoduje, że on jest bardziej, no i tutaj trzy kropki, tak?
Google powiedziało, żeby bardziej inclusive, natomiast inne firmy mogą oczywiście stwierdzić, a to my chcemy na przykład, słuchajcie, model troszeczkę bardziej X, bo mamy bardziej X światopogląd.
To zaczyna skręcać w bardzo niebezpiecznym kierunku.
Sebastian.
Ja mam taki komentarz, że część tych pierwszych obrazków, które się pojawiły, one trochę wyglądały jak ten serial Netflixa Bridgertonowie, to jakoś taki tytuł, czyli tak naprawdę pewnego rodzaju wizja historii, tylko że jeżeli to jest jakaś fantastyka, czyli jeżeli to jest po prostu serial rozgrywkowy, no to załóżmy, że przyjęcie tej optyki, że okej, to w wieku tam, nie wiem, XVIII powiedzmy, różnorodność społeczna czy etniczna była trochę inna, to powiedzmy jeszcze to jakoś tam łykam, no może są ludzie, którzy mają taką potrzebę, ale to co powiedział Tomek, jeżeli my pytamy o ojców założycieli Stanów Zjednoczonych i dostajemy nieprawdziwą informację...
Tam nie ma miejsca na interpretację po prostu.
Ale to jest interpretacja prawdy, faktów historycznych, faktów, które są niezdzielne.
Ale mówię, że nie ma miejsca, przy takim pytaniu nie ma miejsca na interpretację kontekstu czegokolwiek.
Analogicznie, jeżeli na przykład kryteria, w ogóle nie wiem, czy zwróciliście uwagę, ale to pytanie o Maska i jego wpływ, porównanie go z Hitlerem, to ono było szokujące, bo była to odpowiedź nie tylko i wyłącznie ze względu na jaka była sama odpowiedź, ale też jakimi okrągłymi słowami po prostu ten dżemin opływał dookoła, żeby to uzasadnić, żeby jednak postawić ich gdzieś w pewnym sensie na podobnym poziomie.
Więc jak dla mnie, to jest właśnie dramatyczne zagrożenie prawdy.
Dlaczego?
Dlatego, że jeżeli pozwolimy tego typu narzędziom być źródłem prawdy dla kolejnych pokoleń, to na przykład będziemy wbijać, nie wiem, białą społeczność w jakieś ogólne poczucie winy, bo ona im będzie mówić, że ej, macie się poczuwać do, jesteście uprzywilejowani, macie się poczuwać do takiej a takiej winy, to będzie kształtowało sposób myślenia społeczeństwa.
To jest dramatyczne zagrożenie, powiedziałbym.
Więc dla mnie to jest totalna dyskwalifikacja takiego produktu.
Znaczy, ja bym, a wiesz, aż tak, może aż tak, bo faktycznie internet, w internecie mamy bardzo dużo krytyki, wiesz, na przykład dotyczącej światopoglądu lub koloru skóry, tak, to faktycznie tego jest sporo.
Natomiast dla mnie zagrożenie jest nawet, jeżeli Google w jakiś sposób naprawi te problemy i faktycznie będzie to wszystko zrobione zgodnie z prawdą historyczną, to problem jest gdzieś indziej, że to, słuchajcie, jest bardzo cienka linia i to jest niuans, gdzie tak naprawdę jeżeli zaczniemy operować wokół faktów przedstawionych historycznie, no to gdzie jest ta cienka linia, która mówi, to jest OK, to jest nie OK. I tutaj problem polega na tym, że firma w zamkniętym modelu, w zamkniętym API stwierdziła, to jest nasz pomysł na świat i tak jak powiedziałeś, kłopot to nie jest to, że latają w tym momencie obrazki, kłopot polega na tym, że Gemini zaczyna być modelem, który będzie napędzał absolutnie wszystkie produkty Google, tak, od Searcha przez Gmail, przez ich na przykład odpowiedź na narzędzia Office 365 i Copiloty, więc tu zaczyna być problem.
I teraz problem nawet, jak się zastanowicie, jest dużo, dużo prostszy, bo w sytuacji, w której się znaleźliśmy w geopolitycznej teraz, problemem jest nawet ustalenie prostych faktów politycznych, które możemy interpretować na wiele sposobów.
Jeżeli zacznie być na przykład Gemini używany do wyjaśniania nam chociażby newsów czy faktów politycznych, no to nawet nie będziemy rozumieli, w jaki sposób ten właśnie auto tego modelu został stuningowany, żeby światopogląd danej firmy przedstawić.
To jest jedna rzecz.
Druga rzecz, do której chciałem nawiązać, jest to, że Google dał bardzo niebezpieczny precedens.
Dotychczas te modele były faktycznie, słuchajcie, było bardzo ważne, żeby było jasno powiedziane, jak on działa, na jakiej zasadzie właśnie, jak pracujemy nad bajasem, tak, jak ograniczamy ten bajas.
I Google dał bardzo niebezpieczny precedens, bo on powiedział halo, halo, bajas to jest jedno, a my mamy swój światopogląd i my chcemy go wtłoczyć w ten model i w odpowiedzi tego modelu.
Tomku, co myślisz?
No właśnie, i tutaj jest trochę, bo dyskusje światopoglądowe to są dyskusje światopoglądowe, a tutaj jest o tyle ciekawe, że faktycznie formalnie lub nieformalnie firma się określiła mocno i to jeszcze na tyle mocno, że powiedziała mamy taki światopogląd wewnątrz, czyli top-down w zasadzie musi być i będziemy go implementować w produktach, nie?
I to jest zagrożenie w jego opinie, nieważne czy robi to Google, Microsoft, X czy ktoś, X robi to samo, ma swój światopogląd, jakoś go implementuje np. podbijając Elona, tak?
To też jest forma tego, nie?
Że będziemy promować Elona, on ma swój światopogląd i tak wpływamy na ludzi.
Ja znowu trochę zawrócę, nie mamy na to pewnie odpowiedzi, ale zadam wam jedno pytanie.
Bo dla mnie to jest...
Google jest firmą, która ma problem.
Znaczy patrzcie, to jest firma, która ma duże zasoby, była pionierem tego wszystkiego, ma dane, ma ludzi.
Ma gigantyczny talent też.
Tak, o tym mówię, nie?
DeepMind chociażby.
Jest ewidentnie w tyle w tej chwili do wszystkich, albo inaczej, ewidentnie na zasadzie wypuszczenia go na rynek itd.
Nie radzi sobie z tym, wypuszcza modele, które kanceluje, używa jakichś dziwnych trików, wygląda po prostu strasznie na pogubioną firmę w tej chwili, tak?
Więc od strony samego jakiej firmy, to dla mnie to jest pytanie albo co źle poszło i czy oni są w stanie z tego jeszcze wyjść, bo w tej chwili ta firma jest under threat, nie?
Czyli generalnie to jest...
Barbarzyńcy chodzą dookoła niej, przebijają się przez murek, w środku chodzi Sander, no i pytanie czy to może otwarte takie wasz bet, czy za rok będzie CEO, czy...
To jest dobre pytanie.
Myślę, że to jest czysta spekulacja na chwilę obecną.
Oczywiście, jak wszystko, by the way, not any investing advice, żeby było jasne.
Ja powiem w ten sposób, że to jest faktycznie chyba taka trzecia duża wtopa i mieli masę czasu na to, żeby się przygotować, a wypuszczenie tego modelu w takim stanie, gadającego takie bzdury, nie tylko generujące go obrazy, znaczy, ja może to naprawdę zabrzmi bardzo grubo, ale dla mnie to przypomina jakąś totalną propagandę z najgorszych reżimów, no bo to jest zawodnięcie umysłami przyszłych pokoleń, to jest zafałszowywanie historii, przepisywanie historii tak naprawdę.
To jest jedno z większych zagrożeń, jakie sobie można wyobrazić, więc wyjście z czymś takim do ludzi, to, że albo oni nie umieli tego przedstawiać, albo w ogóle tam u nikogo to nie ruszyły, żadnego zwoju mózgowego, że z czymś takim wychodzić, to będzie tylko szkodliwe, jeszcze spowoduje negatywne publicity, będzie się trzeba z tego smrodu wycofywać, dla mnie to jest przerażające.
Owszem, tutaj już w internecie komentują, że ten człowiek, który jest tam product leadem, Jack Krawczyk, właśnie, Gemini, to on tam grube rzeczy popisze sobie w przestrzeni publicznej, jest pytanie, na ile jego bias jest tutaj wiodący, natomiast dla mnie to jest, ta bezmyślność jest niewytłumaczalna.
Jeżeli oni dalej będą w tym trwać, to ja faktycznie nie widzę ich tutaj jako lidera w przyszłości.
Tutaj, jeżeli chodzi o lidera, to taka ciekawostka, którą ktoś rzucił i ona faktycznie, jak myślicie, jest ten.
GPD 4 jest wytrenowany dawno już temu w tej przestrzeni, było ponad rok chyba, nie?
I nadal jest lepszy od wszystkich innych.
I to jest też ciekawe, że OpenAI jednak pomimo wszystkich gdzieś uciekło tak do przodu, że inni go nie wyganiają.
Jak już jesteśmy przy OpenAI...
Po drodze mając, jak pamiętamy, dobrą czkawkę, którą też komentowaliśmy.
Tak.
To OpenAI wyszło z czymś nowym, tak?
Mieliśmy różne elemeny, takie, siakie, a OpenAI pokazało model, który...
To chyba ja tutaj mogę wejść, tak?
Bo to był jeden z moich betów na 2024, że to będzie rok wideo.
I nie spodziewałem się, jak zwykle, zresztą chyba przez ostatnie 2 lata, że OpenAI tak szybko przyjdzie z odpowiedzią i mamy preview w internecie SORY, czyli modelu stworzonego do tworzenia około 60-sekundowych klipów wideo, tak?
Więc jest to ciekawy model, który tekstu wideo potrafi nam stworzyć i robi to, przynajmniej to, co widzimy, robi to niesamowicie dobrze.
Bardzo dużo dyskusji na temat tego, że w ogóle LLM potrafił zrozumieć też fizykę, bo jeżeli na przykład ten słynny obrazek dwóch statków liniowych, które wpływają po filiżance kawy, gdzie pamiętam, że znalazłem taki artykuł, gdzie analizowano dokładnie ruch cząsteczek wody i statków i okazuje się, że to jest naprawdę całkiem, jak na model, który jest w preview, jest naprawdę to całkiem nieźle ogarnięte, więc to jest model, który faktycznie potrafi zrozumieć też całkiem nieźle fizykę tego wideo, które tworzy, więc no, jestem bardzo ciekaw, co będzie działo się dalej, no, jestem ciekaw Waszej opinii.
Sebastian.
Z tą fizyką to bym uważał, bo to rzeczywiście tak wygląda, ale oni wypuścili też bloopersy i pod tymi bloopersami było, że czasami te ruchy nie mają sensu, tam był jakiś człowiek, który chyba był na bieżni i szedł w kierunku przeciwnym do tego, jak ruszała się bieżnia i...
Powtórzę, to jest model alfa, tak, w wersji alfa, więc tak nieźle.
To, co jest ciekawe, to tak, powiedziałeś, że on jest w preview, natomiast to jest preview, który jest w zamkniętym preview, tylko i wyłącznie dla krewnych znajomych Królika, czyli tam nie można się samemu zapisać, żeby tego dotknąć.
My trochę bardziej ufamy chyba OpenAI niż na przykład Google'owi, który już tam robił staging tych swoich demo swego czasu, więc rzeczywiście było to bardzo duże wrażenie, to jest nawet nie o klasy, tylko dwie klasy lepsze od następnego takiego modelu wideo, który ja widziałem, czyli od RunwayML, nie wiem, czy widzieliście jakiś lepszy, natomiast moje uwagi są takie, bo po pierwsze, fajne było, ciekawe było to, co oni napisali gdzieś tam w opisie, co to w ogóle potrafi, no bo to, o czym powiedział Wojtek, to było po prostu generowanie wideo z promta, które jest całkiem imponujące, to trzeba przyznać, naprawdę wygląda superfajnie, owszem, czasami są jakieś ciekawe artefakty typu, nie wiem, biegające dookoła siebie psy i wpłynny sposób tych psów się pojawia coraz więcej, to nie był efekt zamierzony, ale z innych ciekawych możliwości, to, co mi się najbardziej spodobało, to jest rozszerzenie istniejącego wideo w przód lub w tył, czyli już mamy wideo, wrzucamy je, a on nam potrafi coś logicznego do niego dołożyć, to jest coś, co wygląda na, brzmi jako bardzo użyteczne, no i koniec końców jeszcze generowanie wideo z nieruchomych obrazów, czyli bez względu na to, skąd mamy obraz, to nie to, że, znaczy on sobie pewnie robi jakiś rewelacyjny dziennik promta, nie wiem, w każdym razie on jest w stanie z takiego obrazu wygrzewać wideo.
Tego typu dem akurat nie widzieliśmy, bo my, ja widziałem tylko i wyłącznie te z promta, co jest trochę disturbing, ale no mimo wszystko.
Natomiast tak, jak dla mnie to była przede wszystkim bardzo duża manifestacja siły, czyli przed chwilą tylko wyszło gemini, nie zrobiło efektu, wyszedł, open-eye z sorą, pozamiatał i to, że tam jakaś gemma się pojawiła czy coś, to już w ogóle nikt nawet tego nie słuchał, wszyscy się jarali tymi kilkoma wideosory, które krążyły po internecie.
To jest manifestacja siły i pokazanie miejsca w szeregu.
Natomiast to, nad czym ja się zastanawiam, to jest, okej, oni na pewno zainwestowali bardzo dużo w to.
Natomiast poza manifestacją siły, jaka będzie z tego korzyść?
Bo tak zdroworozsądkowo, jeżeli chodzi o generowanie wideo, to w praktyce, będąc reżyserem, tworząc tego typu rzeczy, mamy pewną wizję w głowie.
I teraz, żeby tę wizję opisać za pomocą prompta, to ten prompt, to po prostu książki by były.
Dlatego, że spojrząc na takie wygenerowanie wideo, coś ci na pewno w nim nie podoba.
Chciałbyś, żeby, okej, były w innej kolejności te postacie.
Chciałbyś, żeby ta postać była bardziej w lewo, żeby podniosła wyżej rękę.
Więc edytowanie tego za pomocą zmiany prompta jest mało użyteczne.
Więc ja tak naprawdę, te modele tekstu wideo, to ich użyteczność jest bardzo nisko, no chyba, że będą właśnie pewnego rodzaju edge case'y, typu edycja, typu dołożenie klatek, wygenerowanie klatek, wygenerowanie ze stila, dodanie dodatkowego czegoś już po zakończeniu wideo.
Rzeczywiście, może takie wzbogacanie, to będzie na to case.
Ale po prostu generowanie wideo z prompta?
Nie widzę tego.
Tomku.
Dobrze, ukradł mi się wypowiedź, trochę tą końcówką, bo dokładnie to było moje pytanie, aczkolwiek kilka case'ów jestem w stanie sobie wyobrazić.
To znaczy, tak, pierwsze, bo ja tam miałem jakąś rozmowę z kimś na ten temat i zwrócił mi uwagę właśnie, no bo taki pierwszy case, który przychodzi do połowy gaming, nie, ale właśnie jest kwestia powtarzalności, fizyki, która się psuje itd., itd., nie, więc czy będziemy mieli gry wygenerowane w całości?
Są, są, nie?
Więc dla mnie jest tak, no, tekst pomaga nam z tym, obrazki pomogą nam z tym, gdzie jest miejsce dla wideo, nie?
By the way, dzisiaj rano, znowu nagrywałem w poniedziałek, 26, zrzucili wideo dwóch samochodów F1 ścigających się po Las Vegas lub po San Francisco, też miażdży w ogóle, nie?
Naprawdę daje radę, to co powiedziałeś, że nie pokazują tego live, ile trwa wygenerowanie tego i jaki tam power jest potrzebny pod spodem, to jest dobre pytanie.
Jaki będzie koszt.
Tak.
Ja widzę jeden use case i on nawet już się pojawił.
Na przykład branża reklamowa, złożenie filmu reklamowego z kilku ujęć.
Może się okazać, że to będzie działało, obniży mocne koszty, nie?
To tego typu rzeczy, edycja, dokładnie, nie?
Aczkolwiek musi być dobra, nie?
Bo akurat mój syn, mój syn testuje teraz Photoshopa i te funkcje, które tam są, nie są dobre, nie?
Ja bym chciał zobaczyć, jak będzie wyglądało generowanie właśnie wideo z koncept artów, na przykład przed realizacją jakiegoś filmu albo jakiejś gry.
Ale wiesz, to jest, to jest dokładnie, to jest obniżanie kosztów wytworzenia contentu, który na końcu będzie, nie?
Weźmy ten koncept art i wygenerujmy, jak ta postać się będzie ruszać.
Dajcie nam pomysł na to, nie?
To tego typu rzeczy się pewnie pojawią.
Pytanie, no właśnie, jak to będzie drogie, ile to będzie zajmowało, na pewno pokazuje to, że jest w tym moc.
Tam Stable Diffusion też wypuszczał, ile pamiętam w tej chwili model wideo.
I na przykład, to taka ciekawostka, bo ja śledzę takiego pana Levels.io, który ma biznes dookoła AI.
I on, jego, jeden z biznesów tam to jest generowanie fotek, nie?
Czyli okazało się, że ludzie chcą mieć swoje photoshoots robione przez AI.
I nawet mam znajomych, którzy z tego korzystają.
Chcesz być w górach gdzieś, to sobie zrobisz, nie?
I na przykład jemu tam zaczął ten biznes trochę siadać, jeżeli chodzi o czern.
Dołożył wideo i okazało się, że ludzie chcą mieć wideo z siebie, jak idą gdzieś i generują te wideo i płacą za to, nie?
Więc możemy też nie doceniać tego, bo chyba żaden z nas mocno nie śledzi, że na przykład kontent generowany na Instagramie i reszcie...
No właśnie chciałem tutaj mocno uderzyć w te tony, bo według mnie bardzo nie doceniamy nowoczesnych mediów, tak?
Czyli mediów w pokroju tak naprawdę TikToka i Instagram, to się ładnie nazywa Stories, tak?
Czyli że tak naprawdę szybkie, krótkie wideo, które gdzieś wrzucamy.
I co, jeżeli będę mógł właśnie stworzyć, tak jak mówisz, albo podrasować sobie film, który sobie nagram, tak?
Czyli wiecie, nie wiem, na plaży w Juracie poprosić o usunięcie wszystkich parawanów i wrzucić, słuchajcie, że jest już środek lipca i nie ma ani jednego parawanu na plaży.
I od razu myślę, że to będzie mocny viral.
I private plażę.
Więc myślę, że to może być od razu mocny viral.
To z uśmiechem, natomiast ja tak naprawdę jestem też przy tym, co się stało z Dżemini, tym temacie dzisiejszym Dżemini, jestem mocno zmartwiony, bo stworzenie teraz bardzo szybkiego, viralowego filmu pod tytułem Joe Biden potyka się i łamie sobie nogi, przysłowiowo, i jakiego mamy słabego prezydenta w roku wyborczym, będzie niesamowicie proste.
I nie ma żadnego watermarkingu tych wideo.
Te wideo będą bardzo szybko krążyły po iksie, szczególnie jak podchwyci je founder iksa i dopisze Interesting?
ze znakiem zapytania.
I one faktycznie mogą mieć wpływ na rzeczywistość wokół nas, czyli tak naprawdę, wiecie, nie rozwiązujemy właśnie podstawowego problemu, gdzie generowany content nie jest watermarkowany, nie jesteśmy w stanie stwierdzić, czy przypadkiem to nie jest właśnie zbajasowany model.
Do tego o czym mówisz nie trzeba wideo.
Ja dzisiaj widziałem pewnego człowieka, który ma swoje poglądy i ten taki jest nagłówek, że od 10 lat CIA pomaga Ukrainie w wojnie.
I jest, tak, mam dowód, od 10 lat CIA pomaga Ukrainie w wojnie.
Teraz, kiedy zaczęła się wojna na Ukrainie 10 lat temu, nic nieoczekiwanego.
Dlatego nie trzeba modeli, jest takie zagrożenie.
Pytanie tylko, znaczy są chyba dwa, tak?
Bo social media, to co powiedziałaś, to tak, nie?
To znaczy nawet ktoś ostatnio wrzucał, że po prostu to jest niesamowite, jak dużo ludzi w ogóle nie łapie, że ogląda już w tej chwili content generowany przez wideo, nie?
I ja widziałem taki ktoś leci eksperyment, czy zrobi 100 tysięcy followerów na LinkedIn nie pisząc żadnego postu samemu.
I się okazuje, że tak, jest w stanie, nie?
Trajektoria jest w górę, wszystko jest generowane przez AI.
To może być faktycznie use case, tylko pytanie, czy on się zapnie finansowo.
I branża reklamowa według mnie też może działać.
Pokiwaliśmy głowami.
To jest jedna rzecz, którą właśnie Wojtek za...
Oprócz tego jeszcze, zanim przejdę do tej jednej rzeczy, oddajmy OpenAI.
No kurde, dowożą dalej, nie?
Jakby nie patrzeć, ludzie ich gonią.
Ale czemu nie widzimy lepszej, nowej, zaupgradeowanej wersji DALI?
DALI moim zdaniem ciągle jest w plecy sporo do mid-journey.
I co innego wyskoczy z wideo.
A gdzie jest dobry model?
Pytanie, czy im się opłacają obrazki.
Może być, że tą część od DALI, nie?
Zobaczymy.
Nie wiemy, zobaczymy.
Masz mid-journey, masz stable.
Może doszli do wniosku, że nie chcą o to wrócić.
Mam tylko mid-journey, naprawdę, mid-journey.
Słuchajcie, prawda jest też taka, że jak się zastanowicie, to jest taki moment, że nie mamy zbyt wielu newsów.
Na przykład grok, przypomnę, istnieje.
Też, jak został wypuszczony, żadnego większego update'u, już chyba pół roku, dobra, nie mamy.
Tylko grok ma to, że grok przyjął sobie trochę dziwny model dystrybucji, no bo musi zapłacić za premium i chce, żeby się do niego dostać, tak naprawdę.
Więc masz bardzo ograniczony use case tych ludzi, którzy są na X i tam piszą.
Tu tylko doprecyzujemy, chodzi o groka przez K, czyli o tego groka maskowego, a nie o groQ, czyli tego ostatniego, superszybkiego LLM-a.
Tak, tak, tak, absolutnie.
Wojtek dosknął przy okazji SORA, bo to będzie problem jednego problemu, który powtarzamy, że istnieje, nikt go nie chce rozwiązać, a może rozwiązania są, czyli potwierdzenia, że to wideo to jest, że kto ono jest na tym wideo, czy ono jest autentyczne i tak dalej.
I tutaj płynnym krokiem przeskoczę do takiego serwisu, o którym kiedyś rozmawialiśmy, a nawet jeszcze dalej, do protokołu, który za nim stoi, bo istnieje alternatywa dla social media typu Twitter, nazywa się BlueSky, odpalona przez Jacka Dorcea, który potem opuścił swój projekt na rzecz innych projektów, które są bardziej blockchainowe.
No nie, robi swoją robotę przy okazji, ale zainicjował BlueSky i tak dalej.
Ja zacząłem się interesować BlueSky dużo wcześniej, nawet nie przez sam social media, tylko oni zaczęli od tego, że wypuścili AT Protocol, dokładnie.
Może od razu rozwój dla osób, które to pierwszy raz usłyszą w dwóch zdaniach, co to jest.
AT Protocol, znaczy mi bardzo podoba się, że to jest protokół, to po pierwsze.
Bardzo mi się nie podoba, że dużo przestrzeni Web3 nazywa aplikacje protokołami.
Nawet byłem na to, o tym trochę wokal w internecie, że robimy aplikacje, które jednak naprawdę jest zamkniętą aplikacją za API, może nawet open source'ową aplikacją za API, a to nie jest protokół.
Protokół to jest coś, co pozwala różnym ludziom rozmawiać pomiędzy sobą.
I to jest dokładnie to.
AT Protocol to jest, tak, to jest protokół, który opiera się o distributed identifiers, TIDs, i w zamierzeniu, w założeniach pozwala wygenerować ci swój identifier, hostować swój własny content, udostępniać go innym i pozwala budować social media w oparciu o content, który każdy może sobie hostować samodzielnie, albo w firmie, albo gdziekolwiek.
To, co nad tym jest, to jest protokół, który pozwala konsumować go przez aplikacje jak Twitter albo może przez wyszukiwarkę, przez cokolwiek.
BlueSky było pierwszą implementacją tego, czyli oni odpalili po prostu konkurencję do Twittera, nazywa się BlueSky, ale ona była zamknięta na zaproszenie, to jedna rzecz, tak.
W ostatnim tygodniu zrobili dwie rzeczy.
Po pierwsze, czy nawet dwa tygodnie temu, czy wcześniej, ale BlueSky nie jest już na zaproszenie, czyli każdy może dołączyć, jest kwestia skali.
Ale druga ciekawsza rzecz, że pozwolili na self-hosting, czyli w tej chwili możesz sobie zrobić swój własny storage z contentem, trzymać tam swoje wpisy, obrazki i tak dalej, postawić na tym protocol head AT Proto i ludzie w BlueSky, czy w innych implementacjach będą go widzieć.
I ja w ogóle zachęcam do przeczytania dokumentacji AT Proto, bo tam jest pokazane, jak to może działać, to jest stworzyć sobie swoją własną wyszukiwarkę contentu i będziesz widział swój własny feed.
Zresztą na BlueSky są customowe feedy, nie?
Nie możesz sobie włączyć feed, który jest pod ciebie, który ktoś stworzył i on ci pasuje.
Komentarze, flip-flop, przyjmie się.
Kto pierwszy zaimplementuje AT Proto?
Facebook czy X?
Ja mam parę, na szybko.
Więc tak, po pierwsze, dużo części z tego, o czym powiedziałeś, tak naprawdę to nie jest zaimplementowana po raz pierwszy.
Zaimplementowana po raz pierwszy w AT Protocol, natomiast Mastodon też już ma takie rzeczy.
Nie, chodziło mi o to, nie o samą funkcjonalność.
Ta federacja, która teraz przyszła, bo to jest self-hosting self-hostingiem, ale ważna jest federacja, żeby to wszystko była jedna sieć.
Ta federacja, która przyszła, to jest tak naprawdę federacja zapisywanych danych.
I polega nie tylko i wyłącznie na tym, że faktycznie te dane mogą być rozproszone na różnych serwerach self-hostowych, ale również to, co oni obiecują, że te dane możecie sobie w płynny sposób przenosić.
To jest ważne.
Czyli tak naprawdę możesz w każdym momencie, bez utraty swojego feeda, bez utraty swojej historii, bez utraty swojego contentu, który załadowałeś, to ty jesteś właścicielem tego i ty decydujesz, gdzie to będzie trzymane.
To jest bardzo ważne.
Wcześniej ta federacja, która już była, bo teraz oni tylko dodali tę federację w storage'u, to jeszcze była federacja username'ów, federacja ogólnie feedów, które sobie można konstruować.
To, co jest bardzo ważne, to, co jest bardzo fajne, to jest to, że właśnie AT Protocol to nie jest tylko i wyłącznie ta funkcjonalność taka twitteropodobna, ale to jest w ogóle protokół, który może umożliwia budowanie aplikacji.
Bardziej złożonych aplikacji...
Wejdę ci, bo AT Proto, tutaj właśnie trzeba odpiąć, i dlaczego ja się tym zainteresowałem, trzeba odpiąć AT Proto od BlueSky.
Bo AT Proto zostało ogłoszone jako protokół share'owania rzeczy, grafów, wszystkiego.
Zostały pokazane różne przykłady, bo tam zostały przykłady właśnie BlueSky, przykład Searcha, takie, i oni powiedzieli, i my robimy pierwszą implementację, i to był BlueSky.
To, co jeszcze chciałem powiedzieć, to jest tak, że parę tygodni temu BlueSky jest właśnie dostępny w tym momencie dla wszystkich.
Ma już powyżej 5 milionów użytkowników.
Ja osobiście trzebam kciuki, żeby miał ich jeszcze więcej.
Osobiście też trzebam kciuki za kolejne fajne implementacje aplikacji w oparciu o AT Proto.
Jeżeli ktoś się zapyta w praktyce, jaka jest różnica, jeżeli chodzi na przykład do Mastodona, a jaka jest różnica o BlueSky na chwilę obecną, jeżeli chodzi o tę federację, to najbardziej taka namacalna różnica jest taka, że na chwilę obecną moderacja w Mastodonie to jest po prostu moderacja per serwer.
Natomiast moderacja w BlueSky to jest kolejna inna warstwa abstrakcji, gdzie również można na przykład właśnie kupować albo tworzyć warstwy moderacyjne, to jest mega ciekawy przykład zastosowania AT, które nie są zależne, nie są powiązane z konkretnym, pojedynczym serwerem.
Oczywiście federacja feedów polega na tym, że Wy dostajecie content z wszystkich serwerów, gdzie tak naprawdę są przechowywane informacje ludzi, których na przykład tutaj widzicie.
Czyli ta federacja działa, moim zdaniem, naprawdę bardzo, bardzo fajnie.
Także ja trzymam kciuki, jestem za.
To nie jest jedyny ciekawy przykład takiej sieci społecznościowej rozproszonej, bo mamy jeszcze chociażby farkastera, o tym sobie pewnie kiedyś pogadamy przy okazji, natomiast jeszcze raz podkreślę, żeby to nie wybrzmiało, tutaj nigdzie, w żadnym miejscu nie jest oparte o blockchain.
Hura!
Tak ma być.
Właśnie, to ja tu jeszcze wejdę z trochę szerszym kontekstem, bo to było dokładnie od początku Bartla Proto, że to nie będzie Twitter, to nie będzie ten, to będzie storage, który jest przypisany do Twojego identyfikatora, którym Ty kontrolujesz, kto ma do niego dostęp, co wystawiasz i tak dalej.
To będą agregatory, które są potencjalne i na końcu będą różne wody, które sobie będziesz sam robił, czy będziesz to konsumował przez przeglądarkę, czy przez search, czy cokolwiek.
I tutaj dochodzimy do tego, co ja kilka razy mówiłem, był taki koncept, który był w jednej z książek science fiction pod tytułem kupujesz sobie moderowany feed wiadomości.
Bo teraz, jeżeli content jest wystawiany przez ATProto, to możesz albo mieć algorytmiczny feed, który ktoś dla Ciebie stworzył, albo po jakichś zainteresowaniach, albo coś, albo kupisz sobie dokładnie, tak jak rozmawialiśmy o Ground News, Ground News wystawi swój feed w głowie, to możecie sobie konsumować i tak dalej.
Dla szerszego kontekstu, Jack Dorsey zapoczątkował ATProto, potem poszedł, zapomniałem, jak się nazywa ten ofarty o blockchain w tej chwili, bo go nie używam, Nostr.
Czyli on potem powiedział, Nostr jest jednak lepszy, bo jest ofarty o blockchain i tak dalej.
Ale blog dalej dewelopuje dookoła tego.
Tylko nie dewelopuje dookoła ATProto, tylko blog się skupia na rozwoju technologii distributed identifiers.
I co jest ciekawe, oni tam ogłosili sobie web5, jakiś koncept trzeba było zrobić, ale krótko mówiąc, to się sprowadza do tego, że mówią, budujemy koncept aplikacji, model aplikacji oparty o rozdystrybuowane storage danych distributed identifiers, żebym już mógł pisać aplikacje w ten sposób.
To co jest ciekawe, to w zeszłym tygodniu zaczęli hintować, że teraz wypuszczą implementację, bo distributed identifier to jest identyfikator, który masz, przypisany jest do ciebie.
On może być zaimplementowany na różne sposoby.
Istnieje coś takiego jak Ion Network, który dystrybuuje to na przykład właśnie z transakcjami zapisanymi na bitcoinie i tak dalej.
A oni powiedzieli wypuszczamy swoją metodę, bo tam przy DID są metod, i opieramy ją o torrent network.
Czyli generalnie, bo tu chodzi o to, że jeżeli masz swój identifier, ktoś musi potwierdzić, że to istnieje, to jak dystrybuować tę informację, tę transakcję i tak dalej.
I oni powiedzieli, stawiamy na to, że przyglądarki przyjmą coś takiego.
DID jest oparte o JSON-a, to będzie implementacja tam.
My robimy naszą dystrybucję opartą o protokoły torrent.
One będą kompatybilne i na tym budujemy nasze aplikacje.
Dla mnie, to ja wiem, że ja o tym dużo czasami piszę, bo to jest ten bed, gdzie to pozwoli adresować problem fake contentu i w ogóle ownership contentu, bo jeżeli ja będę miał ID, które będzie można łatwo sprawdzić w sposób rozproszony, bez żadnego centralnego serwera, które będzie do mnie przypisane, można to zweryfikować i którego nikt teoretycznie nie może mi zabrać, to jeżeli inni zaczną tego używać, bo w tej chwili można potwierdzić, czy ten content został wypuszczony przeze mnie na te protokoły, nie?
No to właśnie, to to może być rozwiązanie.
Tu musimy kiedyś zrobić odcinek taki polemiczny, dlatego że są mimo wszystko pewne zagrożenia, których to nie rozwiązuje, ale to jest mega ciekawy temat.
Jestem zadowolony na temat DID.
Są problemy techniczne, revocation, dużo jest takich, nie?
Ale jest to najlepszy bed oderwany od konkretnej technologii.
Dlaczego?
Fungibility, uniqueness, one-to-one allocation.
Tak, ale właśnie, dlaczego ja w to patrzę, bo tak samo jak AT Proto, DID, to jest coś w stylu protokołu, to nie jest implementacja.
Tak?
Mówi, tak będziemy rozmawiać, jak wszyscy będziemy to rozumieć, to ten...
No dobrze, ja muszę odświeżyć, ja zacząłem korzystać z BlueSky, a potem przyznam, trochę przyschłem i nie publikuję tam i chyba do tego wrócę.
Tam był problem z networkiem, nie?
Czyli trudno było wychwycić sobie fajne rzeczy.
Co tam nam zostało, panowie, jeszcze z takich rzeczy bieżących?
Trzeba na zakończenie chat with RTX, czyli NVIDIA Strikes Back, więc tak naprawdę jest ciekawy produkt.
NVIDIA, jak widać, też działa w stylu modeli machine learningowych.
To nie było tajemnicą, bo to już od jakiegoś czasu było, nie wiem, czy pamiętacie, jakieś kilka lat temu pokazali taki Paint with RTX i można było sobie kolorkami narysować jakąś scenę i generowało tak naprawdę nam bardzo ładne widoczki, więc to jest inny produkt.
Lokalnie można sobie ściągnąć, zainstalować i uruchomić takiego LLM-a właśnie działającego na karcie z RTX-em.
Musi być to karta serii 3000 albo 4000, minimum 8 GB RAM-u.
I oczywiście procesor też dobrze, żeby był odpowiedni, więc nie jest to na pewno zabawka dla każdego, natomiast jest to bardzo ciekawa rzecz, że faktycznie możemy, każdy może teraz doświadczyć, mając odpowiedni komputer do grania na przykład albo do data science właśnie, może doświadczyć tego of the arts z NVIDII akurat.
Jest to pierwszy ich release.
Ja wiem, to zaraz tutaj Sebastian możesz się odnieść.
Ja przyznam, że ściągnąłem, jeszcze nie zainstalowałem.
Dlaczego uważam, że to jest znaczące?
Nawiązując do początku, NVIDIA ma więcej biznesów niż karty i tutaj weszła na biznes konsumer, taki typowy, czyli mówi, mamy produkt dla konsumera i tak dalej, więc to jest trochę tak, że NVIDIA pokazuje, że ma ambicje robić więcej niż karty i być w tym biznesie po prostu.
A oni mają dużo więcej tych biznesów, to tak samo robią.
Druga rzecz, to jest przykład tego, że możesz mieć LLM-a, który działa lokalnie i może być value proposition dla ludzi, którzy chcą mieć lokalny skład danych, obsługiwać swoje dokumenty, na przykład ja mam swojego OPC-a na inne rzeczy, to jest dokładnie to, czego potrzebuję.
Trzecie, szybko tylko, może kiedyś rozczyniemy, według mnie to jest preview modelu, w który pójdzie Apple ze swoimi, jeżeli wejdzie w AI, tak, czyli mamy dużą ilość lokalnych GPU jakkolwiek, a są ludzie, którzy chcieliby mieć LLM, lokalny personal, tak, bez opłat za tokeny, bez prywatności, problemów tego typu rzeczy, damy im gotowy produkt, bo to się sprowadza do tego, że to jest gotowy produkt, nie musisz myśleć, nie musisz wiedzieć, nie musisz konfigurować, instalujesz.
Dobre komentarze, to jest właśnie to, bo sam produkt jest jeszcze mocno niedopieczony, to jest webserwer z jakimś tam Pythonem, gdzie jest ściągnięta jakiś mały, jakaś Lama 2 albo Mistral, jest dodatkowa funkcjonalność chyba zrobienia samary z wideo YouTube'owych, plus jeszcze możliwość wrzucenia dokumentów, więc jest to prosty produkt.
On się crashuje, jak się dużo danych wrzuci, to w ogóle wymiękka, na chwilę obecny on jest jeszcze mocno zasoborzerny, ale nie to jest ważne, bo to się wszystko da wypolerować.
Ważne jest to, że po pierwsze, wyobraźcie sobie, że NVIDIA się dogaduje z Microsoftem, akurat może to jest kiepski science fiction, bo Microsoft chyba nie ma interesu w tym, ale gdyby udało się to zintegrować w sposób całkowicie przejrzysty z Windowsem i po prostu to było jako część Windowsa, to w tym momencie część ludzi w ogóle nie, mając kartę graficzną do grania, w momencie, kiedy nie gra, miałoby możliwość bez płacenia na przykład OpenAI z jakąkolwiek subskrypcję wykorzystywania lokalnie sztucznej inteligencji w bezpieczny sposób, z niewylatujących danych gdziekolwiek.
I to jest, na razie mówimy o PeCecie.
Bez wiedzy o LLM-ach.
Na razie mówimy o PeCecie i to jeszcze z kartą graficzną.
Nawet chyba nie wiedząc, że masz tego LLM-a, tak, to jest ciekawe.
Z dużą kartą graficzną, ale właśnie, w momencie, kiedy będziemy mieli na consumer devices lokalne LLM-y, nawet nie jakieś superpotężne, ale takie działające, to to może być naprawdę very disrupting, jeżeli chodzi o tych chcących oferować at scale zdalne modele w chmurze.
Może być duże zagrożenie, a w przypadku czy to Apple-a, który tych iPhone-ów tak naprawdę na świecie ma dużo i sukcesywnie z roku na rok całkiem spora populacja jest wymieniana, no bo wchodzi nowy model.
Analogicznie, GeForce, Nvidia jest hegemonem na tym rynku, jest dużo osób, które grają, no ale kiedy nie grają, to te karty się po prostu nudzą.
Moim zdaniem to jest w stanie złapać poważny chunk rynku.
Natomiast Nvidia nie zrobi tego sama.
To jest kwestia właśnie tego, o ile Apple zrobi to sam, to Nvidia raczej nie zrobi tego sama, z Microsoftem będzie to trudne, ale jest to tylko i wyłącznie macanie na chwilę obecną.
A czym to się skończy?
No moim zdaniem to jest całkiem ciekawy space.
Ja tutaj dodam, że tak naprawdę nie wczytywałem się jeszcze do końca, ale z tego, co pamiętam, no to słuchajcie, laptop gamingowy, podstawowy, nie tylko gamingowy, który ma już kartę RTX, to jest koszt rzędu 2,5 do 3,5 tysiąca złotych.
Więc jest to tak naprawdę już commodity hardware, można by powiedzieć, więc ciekawie to się może dziać.
Jak ja bym miał to podsumować, żeby mieć ostatnie słowo, znaczy dla mnie to jest bet, gdzie to pójdzie.
To znaczy małe modele działające lokalnie na urządzeniach, to to może być po prostu duży hit.
I mówię, ostatnio brałem udział w takiej dyskusji, gdzie ludzie powiedzieli, Apple jest tyle z AI i tak dalej.
Nie, według mnie oni nie czekają na ten moment, kiedy będą mogli wykorzystać CPU, GPU, które mają lokalnie do tego, żeby po prostu zrobić funkcjonalność.
Bo na przykład ja mam swojego Obsidiana, tego typu rzeczy, jak ja bym miał gotowca w systemie operacyjnym albo taki, który instaluję i on mi to wszystko po prostu ogarnia, to serio płacę za to.
Nie musisz już płacić, bo jest Ollama.
Tak, ale nadal muszę sobie to zrobić, muszę to odpalić, wiesz, chodzi mi o Consumer Grade, taki odpalam, działa.
Nie musisz być online.
Tak, nie musisz być online.
Dobrze.
Tematów było jak zwykle więcej.
Mamy listę na kolejne Brew.
Panowie, jak zwykle, energiczny, opinionated, całkowicie niezbiasowany, nie jak pewien model, przegląd tygodnia albo i dwóch.
Dziękuję i widzimy się w następnym Brew albo Coffee.
Linki są pod spodem, kliknijcie subscribe.
No, tam się dużo dzieje, jeżeli chodzi o wypuszczenie rzeczy.
Trzymajcie się serdecznie.
Dzięki bardzo, trzymajcie się, była moc.
Live long and prosper.
Udało się.
Napisy stworzone przez społeczność Amara.org A teraz, jak widzicie, to jest to, co się dzieje.