Компания Meta Platforms представила новую модель искусственного интеллекта с открытым кодом под названием ImageBind, сообщает издание Verge.
Новая модель ИИ связывает несколько форм данных, таких как аудио, текст, визуальные данные, данные о глубине, температуре и движении, которые генерируются инерционным измерительным устройством.
По данным издания, модель – это, прежде всего, исследовательский проект, не имеющий немедленного практического или коммерческого применения, но это шаг к разработке увлекательного, мультисенсорного опыта в системах ИИ, которые могут интегрировать разные наборы данных для создания многомерного индекса. Эта модель представляет собой новаторскую концепцию, поскольку она объединяет шесть типов данных в единое пространство встраивания, что также является основой тенденции генеративного ИИ.
ImageBind может иметь много потенциальных приложений в будущем, включая генерацию видео- или аудио исходных данных и разработку систем виртуальной реальности, имитирующих движения и окружения реальной жизни.
Meta планирует со временем добавить больше потоков данных, включая осязание, обоняние и сигналы головного мозга. Компания настойчиво придерживается открытого кода, вместо того чтобы держать исследования в секрете, поскольку считает, что посторонний контроль может помочь улучшить ее работу, хотя эта стратегия имеет свои риски, учитывая недавнюю утечку языковой модели Llama компании Meta.