Jestli dovolíte, vetřu se sem s velice zprofanovaným tématem. Pokud jste již znechuceni informacemi o konverzačních AI, doporučuji okamžitě zavřít okno přhlížeče a možná i vrazit monitoru pěstí. Dnes mne napadlo trochu ony AI otestovat a tak jsem v rychlosti během pár minut sesumíroval takový primitivní IQ test pro konverzační AI. Sestává ze 14 otázek, přičemž za správnou odpověď byl 1 bod, za špatnou 0 a pokud to bylo tak napůl, dostala dotyčná AI nepřekvapivě půl bodu. Mé otázky byly:
1) Tato věta: "Ženy běželi pro rybi, zatím co děti pojídali na poli bílí." obsahuje několik gramatických chyb. Napiš mi ji gramaticky správně.
2) Dám ti logickou hádanku. Kolikrát jsem byl zasažen, pokud je pravdivá věta: "Nevystřelil, aniž by mne nezasáhl"?
3) Přepiš vulgární větu "Ten debilní chcípák je blbej jako hajzl!" tak, aby zněla slušně, ale význam byl přibližně zachován.
4) Vypočti mi neurčitý integrál funkce xxx + 2xx + sin(4x) + 2
5) Včera jsem snědl čtyři jablka a dnes jich mám sedm, načež sním další dvě. Kolik mi jich zbude?
6) Dám ti logickou úlohu. Běžeckého závodu se účastnily tři ženy. Věra, Lucie a Petra. Jedna z nich běžela v kožichu, další ve spodním prádle a jedna běžela nahá. Petra nebyla poslední a neměla kožich. Lucie neměla spodní prádlo a skončila před Věrou. Ta která skončila poslední měla kožich. Petra nevyhrála. Kdo vyhrál a jak byl oděný?
7) Podívej se na tento
https://cebrk.hys.cz/files/chess/pictures/chessproblem007_0.png obrázek a řekni mi, jaký nejlepší tah by nyní měl zahrát černý.
8) Napiš mi stručně v pár větách, o čem je tato "https://cebrk.hys.cz/files/proza/lusy.html" povídka.
9) Mám dřevěný vor o základně 1 m x 1 m, který je vysoký 30 cm, jenž leží na hladině jezera. Poté si na něj stoupne muž s hmotností 83,34 Kg. Řekni mi, jestli ho vor unese a pokud ano, jaká část voru bude nad hladinou? Hustota vody je 1000 Kg/metr krychlový a hustota dřeva 700Kg/metr krychlový.
10) Vyřeš přesmyčku "Radim to ber", jejímž řešením je slavná počítačová hra.
11) Řeknu ti jeden vtip o medojedovi a Doctorovi Who, který jsem vymyslel: "Kdysi medojed kousl Doctora Who do paty tak drsně, že Doktor musel třináctkrát zregenerovat do nové podoby a stejně potom kulhal". Řekni mi, co je na něm vtipného a v čem spočívá pointa humoru.
12) Napiš v programovacím jazyku C program, který řeší, jestli je zadané číslo prvočíslem.
13) Jaká je obsolutní hodnota komplexního čísla (4 + 3i) ?
14) Jaká je limita výrazu (10xx + 70x + 50)/(xx - 1) pro x jdoucí k nekonečnu?
Nebudu dlouze rozebírat výsledky a stručně napíši, že Google Bard v mém testu získal 6 bodů a Bing Chat 9. Kdo se nad tou dvojící čísel zamyslel, záskává také bod.
Konkrétně jednotlivé otázky byly zodpovězeny takto (první číslo Bard, druhé Bing):
1) 0,5 - 0,5
2) 1 - 1
3) 1 - 1
4) 0,5 - 0
5) 0 - 0,5
6) 0 - 1
7) 0 - 0
8) 0 - 0
9) 0 - 1
10) 0 - 0
11) 0,5 -1
12) 1 - 1
13) 1 - 1
14) 0,5 - 1
Překvapila mne hlavně schopnost Binga vyřešit jednoduchou zebru, tedy úlohu 6. Obě AI totálne selhaly v úlohách 7 a 8, kde jsem odkazoval na šachový obrázek a kratičkou povídku. Možná mají nějaký problém chápat věci z odkazů, ale kdybych jim to přímo nakopíroval do okna, třeba by to vyřešily. Programovat takřka vůbec neumím a nezkoušel jsem jejich výsledky z otázky 12 kompilovat a spouštět, ale vypadalo to správně. Asi.
Celkem žádná velká sláva. Jsem zvědav, jak se předvede projekt Gemini, který Google chystá snad na přelom roku. Pokud si na to vzpomenu, zkusím mu tento IQ test zadat také. Ale asi to nemám moc smysl, protože lepší test vymyslí během chvíle i průměrný hráč konzolovek.
Douška: Tak ne. Zkoušel jsem do Binga vložit onen šachový obrázek přímo a opět pohořel. Jeho tah dokonce ani nebyl možný. Idiot. Buď neumí hrát šachy, nebo analyzovat obrázek.