OpenAI только что анонсировали новые инструменты для создания автономных ИИ

Что-то сегодня в мире ИИ много новостей для разработчиков. На этот раз OpenAI выпустили обновление API, которые должны упростить и ускорить создание собственных агентских систем.

Ссылка на официальный стрим:

Что именно анонсировали?

Сегодня OpenAI представили новый набор инструментов и API, упрощающих создание агентов - систем, способных самостоятельно выполнять задачи от имени пользователей. Эти новинки помогут разработчикам и компаниям быстрее создавать надёжные агентные приложения, снизив необходимость сложной кастомной логики и многочисленных итераций промптов.

1. Responses API

Новое API, которое:

Совмещает простоту Chat Completions и возможности использования инструментов Assistants API.
Поддерживает встроенные инструменты: веб-поиск, поиск по файлам и выполнение задач на компьютере.
Обеспечивает простую интеграцию и доступ к результатам модели через SDK-хелперы.

2. Встроенные инструменты Responses API

А именно:

Веб-поиск:
- Позволяет получать актуальную информацию из интернета с указанием источников.
- Использует модели GPT-4o и GPT-4o-mini.
- Имеет высокую точность (90% по тестам SimpleQA).
Поиск по файлам:
- Быстро извлекает информацию из больших объёмов документов.
- Поддерживает различные типы файлов, метаданные и кастомные настройки ранжирования.
- Удобен для агентов поддержки клиентов, юридических и технических помощников.
Использование компьютера (Computer Use Tool):
- Позволяет агентам выполнять задачи на компьютере, имитируя действия мыши и клавиатуры.
- Работает через модель CUA (Computer-Using Agent), уже показавшую рекордные результаты в веб-задачах.
- Подходит для автоматизации QA, заполнения данных и работы с устаревшими системами.

Пример работы с файлами:

const productDocs = await openai.vectorStores.create({
    name: "Product Documentation",
    file_ids: [file1.id, file2.id, file3.id],
});

const response = await openai.responses.create({
    model: "gpt-4o-mini",
    tools: [{
        type: "file_search",
        vector_store_ids: [productDocs.id],
    }],
    input: "What is deep research by OpenAI?",
});

console.log(response.output_text);

Пример работы с Computer Use:

const response = await openai.responses.create({
    model: "computer-use-preview",
    tools: [{
        type: "computer_use_preview",
        display_width: 1024,
        display_height: 768,
        environment: "browser",
    }],
    truncation: "auto",
    input: "I'm looking for a new camera. Help me find the best one.",
});

console.log(response.output);

Ну и немножко бенчмарков этих тулов:

3. Agents SDK

Открытый инструмент для простой оркестрации многоагентных сценариев (видимо, конкурент LangChain). Включает удобную конфигурацию агентов, механизм передачи задач между агентами, проверки безопасности (Guardrails) и инструменты мониторинга для оптимизации работы агентов.

Agents SDK позволяет удобно конфигурировать агентов с инструкциями, встроенными инструментами, передачей задач и проверками безопасности. SDK уже поддерживает Python, скоро будет доступна поддержка Node.js.

С помощью Agents SDK компании могут быстро интегрировать агенты в рабочие процессы, например, для обработки клиентских обращений, анализа данных и автоматизации продаж.

Пример кода:

from agents import Agent, Runner, WebSearchTool, function_tool, guardrail

@function_tool
def submit_refund_request(item_id: str, reason: str):
    # Your refund logic goes here
    return "success"

support_agent = Agent(
    name="Support & Returns",
    instructions="You are a support agent who can submit refunds [...]",
    tools=[submit_refund_request],
)

shopping_agent = Agent(
    name="Shopping Assistant",
    instructions="You are a shopping assistant who can search the web [...]",
    tools=[WebSearchTool()],
)

triage_agent = Agent(
    name="Triage Agent",
    instructions="Route the user to the correct agent.",
    handoffs=[shopping_agent, support_agent],
)

output = Runner.run_sync(
    starting_agent=triage_agent,
    input="What shoes might work best with my outfit so far?",
)

Планы на будущее

OpenAI стремится сделать агентов неотъемлемой частью рабочих процессов во всех отраслях, значительно повышая производительность труда. Компания продолжит развивать и углублять интеграции и инструменты для быстрого и удобного создания агентов, анонсируя новые возможности уже в ближайшее время.

P.S. В своём телеграм-канале я заставляю ИИ писать мне код, обозреваю свежие новости технологий, а ещё публикую эти самые новости раньше всех. Регулярно даю глубокую аналитику по отрасли и всем событиям, и рассказываю как создавать собственных ИИ-агентов и приложения с ИИ (и как раз на днях потестирую новые API от OpenAI для агентов). И много других интересных непотребств. Велком!

126 просмотров

Обсудить

0 комментариев

Последние

Написать

Комментариев пока нет