Думка: Наскільки великою загрозою є китайська модель штучного інтелекту DeepSeek для OpenAI та інших компаній Кремнієвої долини?
DeepSeek вийшов на ринок США, обігнавши OpenAI в App Store, впливаючи на акції Nvidia, і викликаючи занепокоєння, захоплення та широке впровадження – навіть серед компаній Силіконової долини. Китайський стартап вдалося створити конкурентний продукт AI, який викликає виклик для майбутнього американських компаній AI
На полі AI з’явився новий шериф, і його прибуття потрясло технологічну індустрію всього світу. Лише кілька днів тому DeepSeek, невеликий китайський стартап, випустив свою останню відкриту модель AI, потужний R1, і змусив багато техногігантів, інвесторів та розробників AI панікувати.
Нова модель штучного інтелекту виявилась потужнішою, ніж багато хто очікував. Дуже швидко модель штучного інтелекту DeepSeek набула популярність – можливо, за допомогою китайської мережі, яка допомагала розповсюджувати та просувати її як найбільш передову технологію в світі – та посіла перше місце в магазині додатків Apple в США.
Майже відразу всі новинні портали почали писати про DeepSeek.
OpenAI, яка так впевнено вигравала гонку AI у 2024 році, почала втрачати силу, а акції Nvidia, що стрімко росли, різко впали, втративши майже $600 мільйонів за день. Важко дати точну оцінку того, наскільки великою є ця нова загроза для американської економіки, але вона, безумовно, не мала.
Від проблем з безпекою та потенційних судових позовів до хиткого ринку технологій та вибухового впровадження моделі відкритого AI, ось основна інформація, яку варто знати, щоб розуміти поточну драму з DeepSeek:
Що таке DeepSeek, і чому це вже зараз така велика проблема?
DeepSeek – це невеликий стартап заснований у 2023 році китайським інженером-підприємцем Лян Венфенгом, і підтримується китайським квантовим хедж-фондом High-Flyer Capital Management. Від самого свого заснування він розробляє відкриті моделі штучного інтелекту, але лише кілька місяців тому почав привертати увагу.
На Wizcase ми повідомили, коли вони випустили попередній перегляд моделі DeepSeek-R1-Lite у листопаді і помітили зацікавленість експертів та користувачів в продукті, що вже міг конкурувати з OpenAI’s o1.
DeepSeek запустила DeepSeek-L3, попередника R1, у грудні, і привернула увагу експертів Силіконової долини, таких як Андрей Карпати—колишній дослідник в OpenAI і голова AI в Tesla, що зараз створює освітню платформу, орієнтовану на AI. Карпати відзначив зниження витрат на створення моделі серед інших цікавих особливостей.
Це дешевше, набагато дешевше
Згідно з її офіційним документом, на створення DeepSeek-L3 було витрачено $5.576 мільйонів—враховуючи всі витрати на навчання—тоді як OpenAI витратила понад $100 мільйонів на створення GPT-4 у 2023 році.
Це приблизно на 94% дешевше, ніж GPT-4!
15 січня вони запустили мобільний додаток, а 20 січня китайський стартап запустив свою останню модель AI, засновану на розумінні, R1. Здається, ця модель була створена під впливом Daft Punk “сильніше, краще, швидше, міцніше”, адже вони змогли представити безкоштовний продукт відкритого коду високої якості, який може конкурувати з передовими моделями за дрібку вартості та за рекордно короткий час. Бах!
🚀 DeepSeek-R1 вже тут!
⚡ Продуктивність на рівні з OpenAI-o1
📖 Повністю відкрита модель та технічний звіт
🏆 Ліцензія MIT: Дистилляція та комерційне використання без обмежень!🌐 Веб-сайт та API вже працюють! Спробуйте DeepThink сьогодні за посиланням https://t.co/v1TFy7LHNy!
🐋 1/n pic.twitter.com/7BlpWAPu6y
— DeepSeek (@deepseek_ai) 20 січня 2025
Ціну нової моделі R1 не розголошено. Але багато хто припускає, що вона має залишитися невисокою, оскільки DeepSeek в даний час пропонує свій API за значно меншу вартість, ніж o1 від OpenAI, і, за словами Nature, дозволяє дослідникам випробувати модель.
Маріо Кренн – керівник Лабораторії штучних вчених в Макс Планк Інституті наук про світло в Ерлангені, Німеччина – сказав, що експеримент, який коштує близько $370 з OpenAI’s o1, навіть не коштує $10 з R1. “Це драматична різниця, яка, безумовно, відігратиме роль у його майбутньому прийнятті”, – сказав Кренн Nature.
Місце для поліпшення
Користувачі по всьому світу почали завантажувати додаток для тестування моделі DeepSeek і, після захоплення її захоплюючими здатностями до міркувань, такими як ланцюг думок, вони також помітили декілька особливостей.
Так само, як і будь-яка інша AI модель, R1 від DeepSeek може “галюцинувати”, але китайська модель також фільтрує інформацію, особливо коли вона може вплинути на китайський уряд.
Користувачі поділилися прикладами цензури R1. Вона уникає тем, таких як різанина на площі Тяньаньмінь, Тайвань, або не відповідає на питання, хто такий Сі Цзіньпін.
DeepSeek цензурує свою власну відповідь у реальному часі, як тільки згадується Сі Цзіньпін pic.twitter.com/Nb2ylRXERG
— Джейн Манчун Вонг (@wongmjane) 24 січня 2025 року
Починається юридична битва
Отже, новий китайський додаток за кілька днів завойовує цікавість американців… А як же всі ті питання щодо даних, які раніше викликали стурбованість уряду США щодо іншого популярного китайського додатка, відомого як TikTok — який зараз опинився в невизначеності? Китайська технологія виглядає непереможною, тоді як уряд США здається менш контрольованим.
Модель r1 від deepseek вражає, особливо щодо того, що вони здатні запропонувати за таку ціну.
Ми, безумовно, представимо набагато кращі моделі, і це дійсно освіжаюче мати нового конкурента! Ми підготуємо деякі релізи.
— Sam Altman (@sama) 28 січня, 2025
Незважаючи на публічні привітання, всі підозрювали, як китайському стартапу вдалося створити таку потужну модель за такий короткий час, незважаючи на всі обмеження та відсутність доступу до важливої інформації.
Уряд США вживав строгих заходів, щоб запобігти цьому. Вони заборонили виробникам чіпів продавати свою передову технологію ШІ Китаю, а DeepSeek все одно вдалося створити передові інструменти штучного інтелекту, використовуючи менш передові чіпи Nvidia — наприклад, GPU H800, згадану в статті.
Але уряд США сумнівається, і тепер Департамент торгівлі США проводить розслідування, оскільки вони підозрюють, що найбільш передові чіпи Nvidia були вивезені в Китай шляхом контрабанди.
OpenAI проти DeepSeek
Атмосфера напружена. Уряд США не єдиний, хто має проблеми з довірою. OpenAI разом зі своїм партнером Microsoft також проводять розслідування щодо DeepSeek. Вони вважають, що китайська компанія використовувала дані, що були створені ChatGPT, без дозволу.
OpenAI стверджує, що її моделі могли допомогти у навчанні китайської моделі DeepSeek через процес, відомий як дистиляція – коли велика модель ШІ передає інформацію меншій та більш ефективній моделі.
“Ми знаємо, що групи в КНР активно працюють над використанням методів, включаючи те, що відоме як дистиляція, для відтворення передових американських моделей ШІ”, – сказав представник OpenAI в коментарі для New York Times. “Ми відомо, і ми переглядаємо свідчення, що DeepSeek, можливо, неналежно дистилював наші моделі, і поділимося інформацією, як тільки дізнаємося більше”.
І у цьому є своя іронія, враховуючи те, що OpenAI стикається з численними обвинуваченнями у порушенні авторських прав та використанні даних, зокрема позовом, поданим New York Times, штрафом у розмірі 15 мільйонів доларів за порушення даних в Італії, та недавньою судовою справою про авторські права, порушеною індійськими видавництвами.
Якщо ти не можеш їх перемогти, приєднуйся до них?
Існує ще одне явище в галузі ШІ. Усі великі компанії приймають технологію open-source від DeepSeek – навіть ті, що проводять розслідування щодо китайського стартапу.
Замість того, щоб знаходити проблеми з технологією DeepSeek, Perplexity вирішили швидко її впровадити. Американська компанія пошуку AI інтегрувала R1 в рекордно короткий час у свою платформу, щоб надати користувачам розширений сервіс, заснований на DeepSeek. За прикладом Perplexity пішла Microsoft через кілька днів – так, та сама, що також досліджує DeepSeek – додавши DeepSeek R1 на Azure AI Foundry та GitHub.
Щодня все більше компаній, схоже, приєднуються до цього тренду. Amazon щойно додав моделі DeepSeek-R1 в Amazon Bedrock та Amazon SageMaker AI, а інші компанії, як Aurora Mobile, також інтегрували технологію та навіть збільшили свою долю.
Чи стане DeepSeek новим OpenAI у 2025 році?
Наслідки впливу DeepSeek досі невизначені, а у Китаї здається є кілька карт в рукаві. Alibaba також представила свою останню модель розуміння Qwen 2.5-Max і стверджує, що вона більш потужна, ніж DeepSeek-V3, але поки що їй не вдалося здобути багато прихильників.
Вплив DeepSeek був велетенським, і багато хто вважає, що це кінець гегемонії OpenAI. Американські AI-компанії вже не такі недосяжні, як здавалося, і ми, швидше за все, скоро станемо свідками несподіваного результату. Експерти, як-от вчений Гарі Маркус, говорять, що OpenAI переоцінена і може зіткнутися з подібним майбутнім, як у WeWork. Тож що станеться з проектом “Stargate” вартістю 500 мільярдів доларів, який щойно оголосили OpenAI, SoftBank і президент Дональд Трамп? Робіть свої ставки!
Все вказує на те, що, як тільки OpenAI набрав повну швидкість, змітаючи все на своєму шляху, DeepSeek прийшов, щоб залишитися. В Китаї вони вже отримують публічні похвали, а їх вплив та прийняття вже настільки значні, що їх не можна витіснити з ринку США – мабуть, навіть з більшою силою, ніж TikTok.
Лишити коментар
Скасувати