Что-то сегодня в мире ИИ много новостей для разработчиков. На этот раз OpenAI выпустили обновление API, которые должны упростить и ускорить создание собственных агентских систем.
Ссылка на официальный стрим:
Сегодня OpenAI представили новый набор инструментов и API, упрощающих создание агентов - систем, способных самостоятельно выполнять задачи от имени пользователей. Эти новинки помогут разработчикам и компаниям быстрее создавать надёжные агентные приложения, снизив необходимость сложной кастомной логики и многочисленных итераций промптов.
Новое API, которое:
Совмещает простоту Chat Completions и возможности использования инструментов Assistants API.
Поддерживает встроенные инструменты: веб-поиск, поиск по файлам и выполнение задач на компьютере.
Обеспечивает простую интеграцию и доступ к результатам модели через SDK-хелперы.
А именно:
Веб-поиск:
Позволяет получать актуальную информацию из интернета с указанием источников.
Использует модели GPT-4o и GPT-4o-mini.
Имеет высокую точность (90% по тестам SimpleQA).
Поиск по файлам:
Быстро извлекает информацию из больших объёмов документов.
Поддерживает различные типы файлов, метаданные и кастомные настройки ранжирования.
Удобен для агентов поддержки клиентов, юридических и технических помощников.
Использование компьютера (Computer Use Tool):
Позволяет агентам выполнять задачи на компьютере, имитируя действия мыши и клавиатуры.
Работает через модель CUA (Computer-Using Agent), уже показавшую рекордные результаты в веб-задачах.
Подходит для автоматизации QA, заполнения данных и работы с устаревшими системами.
Пример работы с файлами:
const productDocs = await openai.vectorStores.create({
name: "Product Documentation",
file_ids: [file1.id, file2.id, file3.id],
});
const response = await openai.responses.create({
model: "gpt-4o-mini",
tools: [{
type: "file_search",
vector_store_ids: [productDocs.id],
}],
input: "What is deep research by OpenAI?",
});
console.log(response.output_text);
Пример работы с Computer Use:
const response = await openai.responses.create({
model: "computer-use-preview",
tools: [{
type: "computer_use_preview",
display_width: 1024,
display_height: 768,
environment: "browser",
}],
truncation: "auto",
input: "I'm looking for a new camera. Help me find the best one.",
});
console.log(response.output);
Ну и немножко бенчмарков этих тулов:
Открытый инструмент для простой оркестрации многоагентных сценариев (видимо, конкурент LangChain). Включает удобную конфигурацию агентов, механизм передачи задач между агентами, проверки безопасности (Guardrails) и инструменты мониторинга для оптимизации работы агентов.
Agents SDK позволяет удобно конфигурировать агентов с инструкциями, встроенными инструментами, передачей задач и проверками безопасности. SDK уже поддерживает Python, скоро будет доступна поддержка Node.js.
С помощью Agents SDK компании могут быстро интегрировать агенты в рабочие процессы, например, для обработки клиентских обращений, анализа данных и автоматизации продаж.
Пример кода:
from agents import Agent, Runner, WebSearchTool, function_tool, guardrail
@function_tool
def submit_refund_request(item_id: str, reason: str):
# Your refund logic goes here
return "success"
support_agent = Agent(
name="Support & Returns",
instructions="You are a support agent who can submit refunds [...]",
tools=[submit_refund_request],
)
shopping_agent = Agent(
name="Shopping Assistant",
instructions="You are a shopping assistant who can search the web [...]",
tools=[WebSearchTool()],
)
triage_agent = Agent(
name="Triage Agent",
instructions="Route the user to the correct agent.",
handoffs=[shopping_agent, support_agent],
)
output = Runner.run_sync(
starting_agent=triage_agent,
input="What shoes might work best with my outfit so far?",
)
OpenAI стремится сделать агентов неотъемлемой частью рабочих процессов во всех отраслях, значительно повышая производительность труда. Компания продолжит развивать и углублять интеграции и инструменты для быстрого и удобного создания агентов, анонсируя новые возможности уже в ближайшее время.
P.S. В своём телеграм-канале я заставляю ИИ писать мне код, обозреваю свежие новости технологий, а ещё публикую эти самые новости раньше всех. Регулярно даю глубокую аналитику по отрасли и всем событиям, и рассказываю как создавать собственных ИИ-агентов и приложения с ИИ (и как раз на днях потестирую новые API от OpenAI для агентов). И много других интересных непотребств. Велком!