BE RU EN

ШІ гатовы выцесніць вучоных пасля «апошняга экзамену»

  • 30.03.2026, 10:35

Эксперты кажуць пра прарыў ужо ў бліжэйшыя месяцы.

ШІ ужо да канца года можа прайсці самы складаны навуковы тэст у свеце. Такім чынам штучны інтэлект можа стаць разумнейшым за большасць вучоных.

Эксперты лічаць, што ШІ зможа на 100% прайсці самы складаны навуковы тэст у свеце пад назвай «Апошні экзамен чалавецтва». Гэта можа адбыцца ўжо праз некалькі месяцаў або праз год, піша «Фокус».

У 2024 годзе даследчыкі з кампаніі Scale AI (яна займаецца разметкай дадзеных, неабходных для навучання ШІ) і некамерцыйнай арганізацыі Center for AI Safety сабралі 70 000 пытанняў ад вучоных з 50 краін свету, каб стварыць самы складаны навуковы тэст у свеце.

У выніку быў створаны тэст пад назвай «Апошні экзамен чалавецтва», які складаецца з 2500 пытанняў па матэматыцы, гуманітарных і прыродазнаўчых навуках. Гэты тэст выкарыстоўваецца для праверкі ўзроўню ведаў ШІ.

Кожнае пытанне тэсту патрабуе наяўнасці як мінімум ступені доктара ў адпаведнай галіне навукі. Калі адказаць на ўсе пытанні, можна атрымаць званне «ўніверсальнага эксперта».

Тэст быў створаны, каб вывучаць як шырыню ведаў ШІ, так і глыбіню яго разважанняў. Пытанні патрабуюць кароткага і адназначнага адказу, а адказы на іх складана знайсці ў інтэрнэце. Такім чынам ШІ павінен валодаць вельмі шырокім спектрам ведаў, каб прайсці гэты тэст.

У 2024 годзе ChatGPT ад OpenAI набраў усяго 3% пры праходжанні тэсту, а Gemini ад Google і Claude ад Anthropic паказалі не нашмат лепшыя вынікі.

Тады гэты тэст дапамог развеяць асцярогі наконт таго, што ШІ можа стаць занадта разумным, і паказаў істотную розніцу ў ведах паміж вялікімі моўнымі мадэлямі і найлепшымі вучонымі свету.

Але нядаўна вялікая моўная мадэль Gemini паказала вынік 45,9% пры праходжанні «Апошняга экзамену чалавецтва», а Claude дасягнула выніку 34,2%. ChatGPT не нашмат адстае ад канкурэнтаў.

Кэлвін Чжан з Scale AI заявіў, што ШІ вельмі хутка вучыцца і зможа атрымаць максімальны бал пры праходжанні «Апошняга экзамену чалавецтва» ўжо праз некалькі месяцаў або праз год. Гэта азначае, што калі ШІ пройдзе самы складаны навуковы тэст у свеце, у будучыні давядзецца правяраць штучны інтэлект на пытаннях, на якія ні адзін чалавек не ведае адказу.

І ўсё ж Чжан лічыць, што ШІ не зможа ў поўнай меры засвоіць некаторыя вузкія галіны навукі, а таксама яму будзе вельмі цяжка спаборнічаць з чалавекам у прыняцці рашэнняў, уключаючы разважлівасць і крэатыўнасць.

Як ужо пісаў «Фокус», упершыню камп’ютарная мова, распрацаваная для праверкі матэматычных тэорэм і выяўлення памылак, выявіла памылку ў даследаванні па фізіцы.

Апошнія навіны