
Image generated with OpenAI
Думка: AI моделі – це загадкові “істоти”, і навіть їх творці не повністю їх розуміють
Нещодавнє дослідження компанії Anthropic про те, як працює її модель Claude 3.5 Haiku, обіцяє прогресивні відкриття та іскру розуміння того, як функціонують передові технології ШІ. Але що вони мають на увазі, коли кажуть, що LLMs є “живими організмами”, які “думають”?
Кілька днів тому, Anthropic опублікувала дві статті з прогресивним дослідженням про те, як працюють великі мовні моделі (LLMs). Хоча технічні розробки були цікавими та актуальними, найбільше мене зацікавив словник, який використовували експерти з ШІ.
У дослідженні “Про біологію великої мовної моделі”, дослідники порівняли себе з біологами, які вивчають складні “живі організми”, що еволюціонували протягом мільярдів років.
“Подібно до цього, хоча мовні моделі створюються за допомогою простих, людсько-розроблених алгоритмів навчання, механізми, що виникають з цих алгоритмів, здаються досить складними”, – написали вчені.
За останні кілька років моделі ШІ значно еволюціонували. І ми стали свідками його стрімкого розвитку протягом останніх місяців. Ми бачили, як ChatGPT перетворився з текстової моделі на говорячого супутника, а тепер на багатовимірного агента, який також може генерувати захоплюючі зображення в стилі студії Ghibli.
Але що, якщо сучасні передові моделі ШІ досягають такого рівня розвитку, що навіть їхні творці не можуть зрозуміти їх процеси і системи? Існує багато таємниць, пов’язаних з технологіями ШІ, які можуть бути актуальні для повторного розгляду або занурення у них у 2025 році.
Загадковий парадокс «чорного ящика» моделей ШІ
Існують численні дискусії щодо впровадження AI та розуміння AI, і як ті, хто розуміє, як працюють генеративні моделі AI, менш схильні розглядати чат-боти як своїх “друзів” або “магічні” додатки. Проте є ще одне обговорення – серед експертів та людей, які краще знайомі з технологією – чи порівнювати або вважати LLMs незалежними творіннями. Щодо останнього, існує спеціальний інгредієнт, таємниця, відома як “парадокс чорного ящика AI”, який відіграє вирішальну роль у дискусії.
Системи глибокого навчання навчаються розпізнавати елементи та тенденції подібним чином, як це роблять люди. Так само, як ми вчимо дітей розпізнавати шаблони та призначати конкретні слова різним об’єктам, LLMs були навчені робити унікальні зв’язки та створювати мережі, які стають все складнішими, коли вони “ростуть”.
Самір Равашде, доцент кафедри електротехніки та комп’ютерних наук, спеціалізується на штучному інтелекті та пояснює, що так само, як і в процесі вивчення людського інтелекту, майже неможливо реально бачити, як системи глибокого навчання приймають рішення та роблять висновки. Це те, що експерти називають “проблемою чорного ящика”.
Моделі ШІ викликають виклики для людського розуміння
Нещодавнє дослідження компанії Anthropic пролило світло на ситуацію з чорним ящиком ШІ, пояснивши, як її модель “думає” в певних сценаріях, які раніше були неясними або навіть повністю неправильними. Навіть якщо дослідження базується на моделі Claude 3.5 Haiku, воно дозволяє експертам розробляти інструменти та аналізувати подібні характеристики в інших моделях ШІ.
“Розуміння природи цього інтелекту – це глибокий науковий виклик, який має потенціал переосмислити наше уявлення про те, що означає ‘думати'”, – зазначається у статті, поділеній дослідниками з Anthropic.
Однак термін “думати”, присвоєний технологіям штучного інтелекту, непокоїть деяких експертів у галузі і є частиною критики дослідження. Користувач Reddit пояснив, чому це дратує групу людей: “У статті дуже багато антропоморфізації, яка затулює роботу. Наприклад, вона постійно вживає слово ‘думати’, коли повинно бути ‘обчислювати’. Ми говоримо про програмне забезпечення для комп’ютера, а не про біологічний мозок.”
Хоча “людянізовані” терміни допомагають не технічним людям краще розуміти моделі ШІ та спричиняють дебати в спільноті, правда полягає в тому, що, незалежно від того, кажемо ми “обчислювати” або “думати”, та сама проблема залишається: у нас немає повного розуміння або повної прозорості щодо того, як працюють LLM.
Чого чекати від розвинутих моделей ШІ в найближчому майбутньому
Чи можете ви уявити, що ігноруєте існування розвинутих технологій ШІ, таких як ChatGPT, DeepSeek, Perplexity або Claude – зараз або в найближчому майбутньому? Всі знаки вказують на те, що немає шляху назад. Генеративний та розумовий ШІ вже перетворили наше повсякденне життя, і вони тільки продовжуватимуть еволюціонувати.
Майже щодня в WizCase ми повідомляємо про нові події в індустрії – нову модель AI, новий інструмент AI, нову компанію AI – які мають потенціал внести великий вплив на наше суспільство. Ідея зробити перерву, щоб спочатку краще зрозуміти ці передові моделі та принципи їх роботи – або навіть трохи сповільнити – здається неможливою, враховуючи швидкий темп гонки AI та участь урядів та найпотужніших компаній світу.
«Моделі AI все більше впливають на наше життя та роботу, тому ми повинні розуміти їх достатньо добре, щоб забезпечити їх позитивний вплив», – говориться в доповіді Anthropic. Навіть якщо це звучить трохи нереалістично, дослідники залишаються оптимістичними: «Ми віримо, що наші результати тут, та траєкторія прогресу, на яку вони спираються, є захоплюючими свідченнями того, що ми можемо справитися з цим викликом».
Але наскільки швидко ці відкриття можуть рухатися? У статті також зазначається, що результати включають лише декілька областей та конкретних випадків, і не можна будувати більш загальні висновки. Тому, мабуть, не достатньо швидко.
У той час як регулятори вводять такі заходи як Закон про ШІ ЄС, вимагаючи більшої прозорості, зокрема отримуючи звинувачення та наруги від великих технологічних компаній за погіршення прогресу, потужні моделі ШІ продовжують розвиватися.
Як суспільство, ми повинні прагнути знайти рівновагу між поглибленням нашого розуміння того, як функціонують ці технології, та їх впровадженням таким чином, щоб вони приносили значущі переваги та прогрес нашим громадам. Чи це можливо? Ідея просто молитися чи сподіватися, що ці “істоти” залишаться “етичними” і “добрими” зараз не здається такою вже віддаленою.
Лишити коментар
Скасувати