​ПОСЛЕ ЭТОЙ АИШКИ В КРЕМНЕВОЙ ДОЛИНЕ НАЧАЛСЯ СУЩИЙ…

​ ПОСЛЕ ЭТОЙ АИШКИ В КРЕМНЕВОЙ ДОЛИНЕ НАЧАЛСЯ СУЩИЙ КОШМАР….

немного новостей из мира AI как вы знаете дела у Сэма Альтмана и его OpenAI шли в гору, даже несмотря на многочисленные скандалы и личного хейтера в виде Илона Маска.

А все потому что OpenAI вот-вот станет for-profit (в конце 2025 года) и старина Сэм претендует на 7%-11% от компании вдобавок, AI уже давно стал инструментом политического воздействия и Трамп в самом начале срока уже обьявил о проекте Stargate, целью которого является инвестиция 500 миллиардов долларов в инфраструктуру для развития AI в США.

Но на удивление, Байден использовал более жесткие меры для получения преимущества в ИИ гонке: с 2022 года вводились ограничения на экспорт мощных графических процессоров в Китай, а перед концом срока его администрация обьявила уже о полном запрете.

но тут опа и черный лебедь в виде новой AI модели — DeepSeek.

вот часто говорят «как бы ты хорошо не делал что-то — найдется азиат который сделает лучше».

в целом так и произошло.

DeepSeek был основан в мае 2023 года как независимая дочерняя компания хедж-фонда High-Flyer, который управляет активами на $8 млрд и является одним из лидирующих хедж-фондов в Китае.

при этом, DeepSeek не был основным приоритетом High-Flyer — он финансировался и воспринимался как сайд-проект основателя фонда.

так в чем же прикол?

в том, что китайские инженеры смогли обучить продвинутую модель DeepSeek всего за 5,58млн$.

Для сравнения, обучить GPT4 обошлось OpenAi в ±80млн$.

вдобавок, запросы к api DeepSeek продает в 10-15 раз дешевле чем конкурентов, что повышает ее привлекательность для девов да и для обычных людей.

что интересно, по «официальной» версии, ДипСик был обучен на 10,000 NVIDIA A100, которые High-Flyer купили еще до запретов — это все еще сильно меньше ресурсов, чем у OpenAI.

вишенка на торте — DeepSeek полностью опенсорсный и позволяет легко развернуть его локально, что позволяет спокойно кормить ему даже чувствительную информацию.

по перфомансу, DeepSeek работает очень даже неплохо ( бенчмарк ).

в большинстве кейсов он выдает ответы на одном уровне с o1.

в некоторых вопросах он перформит лучше, а с учетом того что его можно развернуть локально — существует еще и простой байпасс фильтров (например DeepSeek не может говорить о Си Цзиньпине) моим фаворитом все равно пока остается Claude , но думаю это вопрос времени когда ДипСик станет лучше.

также, этот релиз сопровождается огромному количеству конспирологии.

бытуют мнения, что: — DeepSeek врут в финансовых отчетах — DeepSeek нелегально получили доступ к американскому вычислительному оборудованью — Это все psyops Китая, чтобы подорвать внутреннюю безопастность США но пусть на это время тратят кто-то еще.

факт в том, что подобный компетишн заставит OpenAI двигаться, ну или хотя бы найти оправдание почему их модель обходится в 10 раз дороже чем китайский опенсурсный сайд проект.

дипсик: https://deepseek.com/

Оставьте комментарий