Нейросети отправят на дообучение - «Компьютеры и интернет»
Компании смогут обучить самую мощную модель от OpenAI на собственных данных. Разработчики открывают такой функционал в системе GPT-4o. Это позволит тонко настроить чат-бота, чтобы он, например, общался с клиентом на конкретные темы, которые связаны с этим бизнесом. Инженеры утверждают, что дообучение модели под свои нужды занимает около двух часов — достаточно загрузить свои данные. Отправить можно только текст: картинки или звук система обработать не сможет.
Как работает этот механизм? И какие у него есть ограничения? На эти вопросы “Ъ FM” ответил гендиректор разработчика систем искусственного интеллекта «А-Я эксперт» Роман Душкин: «Мы обучаем нейронные сети, загружая в них не знания, а данные. Дальше они самостоятельно формируют знания внутри своих связей между нейронами. И если мы говорим про какую-то компанию, то всегда есть какая-то база сведений о том, как вести дела. Соответствующий текст закладывается внутрь этих моделей, но там есть свои минусы.
Нельзя быть уверенным, что эта система правильно восприняла наши знания, потому что она их хранит неявно. Нет гарантий, что модель не начнет галлюцинировать.
Конечно, есть метрики качества, и, собственно, за ними всегда следит разработчик при обучении ИИ. Эти метрики направлены на понимание того, насколько нейросеть точно отвечает на вопросы, в том числе по конкретной предметной области. Кроме того, эту сферу знаний можно и ограничить. Делается это с помощью внешних надстроек, то есть задаются рамки ровно в той предметной области, которая нам нужна. Если мы продаем кроссовки, модель будет говорить только о них, а если мы попросим ее рассказать про ботфорты, то она ответит, что ничего про них не знает».
К OpenAI было немало претензий, связанных с незаконным использованием контента. Например, иск к компании подала The New York Times, утверждая, что разработчики без разрешения обучали модель на материалах газеты. При этом OpenAI обещает, что не будет использовать информацию, которую ей отправят бизнес-клиенты, отметил сооснователь AiAcademy Александр Горный: «GPT-4, GPT-4o или любая другая модель обучается на всем, что найдет OpenAI в публичном интернете или сам сгенерит. К этой базовой модели компания тренирует свою собственную систему, которая доступна только для компании. Она обучается на серверах OpenAI.
Разработчик обещает, что те данные, которые используются в этом дообучении, используются только здесь и никуда дальше не пойдут. В большинстве случаев, если речь идет исключительно о
коммерческом использовании, скорее всего, это правда.
Компания, безусловно, заинтересована в этих данных, но нарушать свое соглашение в настолько чувствительном месте — это преступление и риск для репутации. Вот банки заинтересованы в наших деньгах, но обычно их не воруют, хотя мы отдаем средства им на хранение. Если же говорить про какие-то конфиденциальные данные, то это может являться нарушением законов. Так, если это российская компания, то отправлять какие-то персональную информацию в OpenAI нельзя, потому что это другая юрисдикция. В других случаях это вполне можно делать, взвешивая риски. То есть у OpenAI их могут украсть, например».
Недавно OpenAI анонсировала запуск собственной поисковой системы на базе искусственного интеллекта. Проект получил название SearchGPT, в закрытом тестировании поучаствуют около 10 тыс. пользователей.
Илья Сизов