Казахстанские стартаперы разрабатывают будущего конкурента OpenAI
Обычно публикации о стартапах пишутся или в форме интервью, где герой отвечает на вопросы о своем проекте, или очерка с рассказом о становлении бизнеса. О том, что делает 28-летний уроженец Алматы Ерзат Дулат, хочется написать сценарий для кинохита, что-то вроде «Игры в имитацию».
Как наградить ИИ за хорошее поведение Начинаться фильм должен с эпизода, где Ерзат представляет свой стартап венчурному инвестору Мурату Абдрахманову. В мае 2023 года он «питчил» Higgsfield AI - компанию, которая занимается разработкой фундаментального искусственного интеллекта. - Higgsfield AI — будущий конкурент OpenAI (создателя СhatGPT), только в сфере генерации медиа и видео, - объяснял Ерзат бизнес-ангелу. - Конкретно мы занимаемся Reinforcement Learning (обучение с подкреплением). Это такой раздел искусственного интеллекта, где у вас есть агент, который находится в какой-то среде. Средой может быть компьютерная игра, или шахматы, или более сложная среда. И агент пытается оптимизировать функцию награды. Если это компьютерная игра, он пытается оптимизировать очки, если это шахматы, то количество выигранных партий. Reinforcement Learning — это путь к сильному ИИ, который может превзойти человеческий интеллект. Тот же ChatGPT был обучен с помощью Reinforcement Learning: в нем наградой для модели служит human feedback или human preferences, то есть Chat GPT старается получить награду за то, что его ответ понравился пользователю. Сцена питчинга кончается тем, что инвестор одобрительно кивает и подписывает договор на pre-seed-раунд финансирования.
На многомилионный раунд A венчурного финансирования обратила внимание... →
Следующий эпизод — ретроспективный. Ерзат вспоминает себя в школе, легендарной алматинской РФМШ, на уроках физики. Учитель, видя его успехи, отправляет Ерзата на олимпиады по предмету, и будущий стартапер выигрывает их одну за одной. В старших классах Ерзат начинает заниматься software engineering — программной инженерией, то есть созданием компьютерных систем и приложений для решения реальных проблем. Если точнее, то машинным обучением, где пригодились его знания математики и физики. Далее в кадре — Ерзат перед монитором, общается в специализированной социальной сети для программистов GitHub. Там он выкладывает свои разработки — имплементацию алгоритмов с открытым исходным кодом в искусственном интеллекте. У него множество подписчиков, его идеи применяют в университетах уровня Гарварда и лучших исследовательских лабораториях США и других стран. Следующий этап — работа в крупных казахстанских компаниях. Редкий специалист по машинному обучению, один из первых в Казахстане, Ерзат обучает других айтишников, формирует целые отделы машинного обучения в таких компаниях, как Kaspi.kz, Kolesa, ERG. В кадре — внимательные лица недавних выпускников мехмата МГУ, которым наш герой объясняет отличия современного machine learning (при этом сам Ерзат окончил только РФМШ и не учился в университете). Почему невыгодно продавать лопаты Переходим к эпизоду знакомства Ерзата с Николаем Давыдовым. Венчурный инвестор, известный по фильму Юрия Дудя о Кремниевой долине, советует казахстанцу заняться своим бизнесом и сводит с его с Алексом Машрабовым. Алекс - опытный фаундер, за спиной которого «экзит» в $160 млн и работа директором по ИИ в соцсети Snapchat. В студенческие годы Алекс был финалистом мирового чемпионата по спортивному программированию. Молодые люди решают запустить стартап, позволяющий каждому персонализировать модель под свои предпочтения, где Reinforcement Learning будет неотъемлемой частью. После триумфа ChatGPT в мире технологий уже все понимают, что за «обучением с подкреплением» будущее. В июне 2023 года они запускают стартап Higgsfield AI.

Начинается дискуссия — не научится ли их модель производить дип-фейки и прочие нехорошие вещи? Как запретить модели это делать, ведь она самообучающаяся и у нее могут сами собой возникнуть незаложенные ранее свойства? В ИТ-среде контроль за ИИ называется AI alignment, айтишники так и говорят - «алайнить модель». - Технически AI alignment решается Reinforcement Learning. Мы можем давать модели награду за поведение, которое нам нравится, и наоборот — «наказывать» ее, давать отрицательную награду, если не нравится. И модель будет стараться не делать вещи, за которые вы ее «наказываете». Мы обучим модель с помощью Reinforcement Learning так, чтобы она не генерировала какие-то неприемлемые видео, - разъясняет решение проблемы Ерзат. Финальная сцена нашего фильма — аплодисменты на подписании контракта с фондом Menlo Ventures, одним из столпов Кремниевой долины. Menlo Ventures - AI-фонд номер один среди венчурных фондов, недавно вложивший сотни миллионов в прямого конкурента OpenAI – компанию Anthropic. Инвестиции seed-раунда в Higgsfield AI составят $8 млн, но это только начало. Учитывая отношение Мурата Абдрахманова, получается, что и в Казахстане, и Кремниевой долине уверены, что Higgsfield AI поднимется на тот же уровень, как и ChatGPT, а, может, и превзойдет его.Hi! We’re Higgsfield - a Video AI company that's democratizing social video creation to everyone. Our game changing foundational model excels at creating personalized characters with lifelike motion - with just 1 selfie and all on mobile. We bring any story to life. Watch pic.twitter.com/b4BogCjwUF
— Higgsfield AI (@higgsfield_ai) April 3, 2024