Китайският ИИ-стартъп DeepSeek предизвика вълнение в Силициевата долина

Най-четени

Емил Василев
Емил Василевhttps://www.kaldata.com/
Емил Василев редовно превежда сложни научни теми на достъпен език — от въпроси като „Какво е имало преди Големия взрив?" до практическото приложение на биотехнологиите в лечението на болести. Тази комбинация от технологична и научна журналистика го прави един от най-разностранните автори в екипа на Kaldata.

Китайският милиардер и собственик на хедж фонд Лианг Уенфън стартира DeepSeek – стартъп за изкуствен интелект, който разработва усъвършенствани големи езикови модели с ограничен бюджет и технически ресурси и разказа как може да се направи това. По този начин компанията изпреварва лидерите на американския пазар и предизвиква доста вълнения, пише Financial Times.

Тази седмица DeepSeek пусна „разсъждаващия“ ИИ-модел R1 и публикува инструкции как да се изгради икономически ефективно голям езиков модел, способен да се самообучава и подобрява без човешки контрол.

Пионери в разработването на „разсъждаващи“ модели, които имитират човешките когнитивни способности са OpenAI и Google DeepMind. През декември OpenAI пусна пълната версия на своята невронна мрежа o1, но не разкри как е ръководила нейното разработване. Пускането на R1 от DeepSeek повдигна въпроса дали добре обезпечените с ресурси американски компании с проекти в областта на изкуствения интелект, включително Meta и Anthropic могат да запазят технологичното си предимство.

Още през 2021 година Лианг Уенфън започва да купува хиляди графични процесори Nvidia за своя страничен проект – основното му работно място е фондацията High-Flyer. По онова време действията му се разглеждаха като ексцентричното поведение на милиардер, който си търси ново хоби.

Никой не прие думите му на сериозно, когато говореше за пускането на клъстер от 10 000 ИИ-ускорителя на Nvidia и той не можеше да формулира целите си – той просто казваше: „Искам да създам това и то да промени играта“. Смяташе се, че само гиганти от мащаба на ByteDance и Alibaba са в състояние да направят това. Той направи милиардите си в High-Flyer, като използваше изкуствен интелект и алгоритми, за да идентифицира модели, които биха могли да повлияят на цените на акциите. Екипът му е достигнал висоти, използвайки чипове на Nvidia за търговия с акции.

През 2023 година Уенфън стартира стартъпа DeepSeek и обяви намерението си да създаде ИИ на човешко ниво. Санкциите на САЩ, които ограничават достъпа на китайските компании до ИИ-ускорители не са попречили на работата на компанията – нейните инженери вече са знаели „как да отключат потенциала на тези графични процесори, дори те да не са най-новите модели“.

Това, което прави DeepSeek особено опасна, е, че тя е готова да сподели постиженията си, вместо да ги крие с цел търговска изгода. Компанията не е набирала средства от външни източници и не е предприела значителни стъпки за монетизиране на моделите си.

Нейната сфера на дейност е изследователската и инженерната, което е сходно с DeepMind в началото на създаването си. Лианг характеризира DeepSeek като „местна“ компания, с докторанти от най-добрите китайски университети, а не от американски институции. Миналата година той заяви в интервю, че в основния екип няма хора, които да са се завърнали от чужбина.

За обучението на един от моделите си с 671 млрд. параметри DeepSeek е използвала само 2048 ИИ-ускорителя Nvidia H800 и е похарчила 5,6 млн. долара, което е малка част от разходите на OpenAI и Google за обучение на системи със сравним размер. Експертите признават, че в Китай наистина има много специалисти, които знаят как да обучават и управляват ИИ-модели с ограничени изчислителни ресурси, но няма гаранция, че DeepSeek ще може да остане конкурентна с развитието на индустрията. Междувременно рентабилността на High-Flyer, компанията, за чиято сметка съществува DeepSeek претърпява спад тъй като нейният главен изпълнителен директор сега се интересува повече от ИИ-технологиите.

Всичко важно от света на технологиите, директно в пощата ти.

С абонирането приемате нашите Условия и Политика за поверителност. Може да се отпишете с един клик по всяко време.


Коментирайте статията в нашите Форуми. За да научите първи най-важното, харесайте страницата ни във Facebook, и ни последвайте в Google Новини, TikTok, Telegram и Viber или изтеглете приложението на Kaldata.com за Android, iPhone, Huawei, Google Chrome, Microsoft Edge и Opera!

2 Коментара
стари
нови оценка

Нови ревюта

Подобни новини