Image by Matheus Bertelli, from Pexels

AI DeepSeek навчається думати самостійно

Час читання: 2 хв.

Вперше опубліковано: Apr 8, 2025

Оновлено 2 разів з моменту публікації

Написано Кіара Фаббрі В минулому — авторка статей про технічні новини
Переклад Команда з локалізації та перекладу Послуги локалізації та перекладу

Китайський стартап DeepSeek, у партнерстві з університетом Цинхуа, заявляє, що вони розробили розумніший спосіб допомоги моделям штучного інтелекту думати краще та швидше, без потреби в великих комп’ютерах або дорогих ресурсах.

У поспіху? Ось основні факти:

DeepSeek створила самовдосконалюваний AI за допомогою налаштування критики за принципами самостійності (Self-Principled Critique Tuning – SPCT).
SPCT навчає AI оцінювати свою власну роботу, використовуючи самостійно створені правила.
Цей метод підвищує продуктивність без використання масивної обчислювальної потужності.

Прорив походить від нової техніки, яку називають Налаштуванням Самостійної Принципової Критики (SPCT). SPCT відрізняється від простого збільшення розміру моделей AI для підвищення продуктивності – SPCT не вимагає великої кількості енергії та обчислювальної потужності для навчання AI оцінювати свою власну роботу за допомогою набору самостійно створених правил.

Спосіб роботи полягає в тому, що вбудований “суддя” перевіряє, чи дотримується відповідь AI своїх внутрішніх правил розуміння і чи відповідає вона вимогам людського висловлення. Коли AI надає переконливу відповідь, він отримує позитивний зворотний зв’язок, що допомагає йому поліпшувати свої навички відповідей на подібні питання в майбутніх випадках.

DeepSeek впроваджує цей метод як частину своєї системи DeepSeek-GRM, що означає Generative Reward Modeling. GRM працює інакше, ніж традиційні методи, оскільки він виконує паралельні перевірки для підвищення точності та узгодженості.

“Ми пропонуємо метод самоорганізованого критичного налаштування (Self-Principled Critique Tuning – SPCT) для стимулювання масштабного формування поведінки заохочення,” – написали дослідники у своїй статті. “SPCT дозволяє [моделі] адаптивно формувати принципи та критикувати на основі вхідного запиту та відповідей, що призводить до кращих винагород.”

За допомогою цієї системи, DeepSeek стверджує, що її ШІ тепер може показувати кращі результати, ніж у конкурентів, таких як Gemini від Google, Llama від Meta та GPT-4o від OpenAI, особливо коли йде мова про складні завдання, такі як розуміння або прийняття рішень, як зазначено в Euronews.

Важливо, DeepSeek заявляє, що планує випустити ці нові інструменти як відкрите програмне забезпечення, хоча дата релізу поки що не була оголошена.

AI DeepSeek навчається думати самостійно

Ми дуже раді, що вам сподобалась наша робота!

Лишити коментар