айтишнику.рф

DeepSeek выпустила мультимодальную нейросеть Janus-Pro-7B

Разработчики нейросети отмечают, что Janus Pro — улучшенная версия Janus, который компания выпускала ранее. В обновлении инженеры оптимизировали стратегию обучения, увеличили датасет и масштабировали размер самой модели. Всё это позволило выйти на новый уровень в задачах генерации картинок по текстовому описанию и анализу изображений. В бенчмарках GenEval и DPG-Bench нейросеть превосходит открытую Stable Diffusion 3 Medium и коммерческую DALL-E 3 от OpenAI.

Модель машинного обучения Janus-Pro-7B опубликована на площадке Hugging Face. Команда проекта призывает сторонних исследователей и разработчиков присоединиться к проекту. Код модели открыт и распространяется по лицензии MIT, а сама нейросеть — по лицензии DeepSeek.

В ноябре 2024 года китайская компания DeepSeek выпустила открытую «рассуждающую» языковую модель R1, которая по качеству сгенерированных ответов сопоставима с коммерческой GPT o1. При этом китайская нейросеть доступна бесплатно. Релиз R1 спровоцировал падение акций Nvidia, так как инженерам DeepSeek удалось обучить масштабную нейросеть без дорогостоящих видеокарт, на которые распространяются санкции экспортного контроля для разработчиков из Китая.

27 января 2025 года приложение DeepSeek заняло первое место в рейтинге бесплатных приложений американского App Store. В этот же день компания приостановила регистрацию новых пользователей из-за DDoS-атаки на веб-приложение и API сервиса.

84 просмотра
0 комментариев
Последние

Комментариев пока нет