айтишнику.рф

OpenAI только что анонсировали новые инструменты для создания автономных ИИ

Что-то сегодня в мире ИИ много новостей для разработчиков. На этот раз OpenAI выпустили обновление API, которые должны упростить и ускорить создание собственных агентских систем.

Ссылка на официальный стрим:


Что именно анонсировали?

Сегодня OpenAI представили новый набор инструментов и API, упрощающих создание агентов - систем, способных самостоятельно выполнять задачи от имени пользователей. Эти новинки помогут разработчикам и компаниям быстрее создавать надёжные агентные приложения, снизив необходимость сложной кастомной логики и многочисленных итераций промптов.

1. Responses API

Новое API, которое:

  • Совмещает простоту Chat Completions и возможности использования инструментов Assistants API.

  • Поддерживает встроенные инструменты: веб-поиск, поиск по файлам и выполнение задач на компьютере.

  • Обеспечивает простую интеграцию и доступ к результатам модели через SDK-хелперы.

2. Встроенные инструменты Responses API

А именно:

  • Веб-поиск:

    • Позволяет получать актуальную информацию из интернета с указанием источников.

    • Использует модели GPT-4o и GPT-4o-mini.

    • Имеет высокую точность (90% по тестам SimpleQA).

  • Поиск по файлам:

    • Быстро извлекает информацию из больших объёмов документов.

    • Поддерживает различные типы файлов, метаданные и кастомные настройки ранжирования.

    • Удобен для агентов поддержки клиентов, юридических и технических помощников.

  • Использование компьютера (Computer Use Tool):

    • Позволяет агентам выполнять задачи на компьютере, имитируя действия мыши и клавиатуры.

    • Работает через модель CUA (Computer-Using Agent), уже показавшую рекордные результаты в веб-задачах.

    • Подходит для автоматизации QA, заполнения данных и работы с устаревшими системами.

Пример работы с файлами:

const productDocs = await openai.vectorStores.create({
name: "Product Documentation",
file_ids: [file1.id, file2.id, file3.id],
});

const response = await openai.responses.create({
model: "gpt-4o-mini",
tools: [{
type: "file_search",
vector_store_ids: [productDocs.id],
}],
input: "What is deep research by OpenAI?",
});

console.log(response.output_text);

Пример работы с Computer Use:

const response = await openai.responses.create({
model: "computer-use-preview",
tools: [{
type: "computer_use_preview",
display_width: 1024,
display_height: 768,
environment: "browser",
}],
truncation: "auto",
input: "I'm looking for a new camera. Help me find the best one.",
});

console.log(response.output);

Ну и немножко бенчмарков этих тулов:

3. Agents SDK

Открытый инструмент для простой оркестрации многоагентных сценариев (видимо, конкурент LangChain). Включает удобную конфигурацию агентов, механизм передачи задач между агентами, проверки безопасности (Guardrails) и инструменты мониторинга для оптимизации работы агентов.

Agents SDK позволяет удобно конфигурировать агентов с инструкциями, встроенными инструментами, передачей задач и проверками безопасности. SDK уже поддерживает Python, скоро будет доступна поддержка Node.js.

С помощью Agents SDK компании могут быстро интегрировать агенты в рабочие процессы, например, для обработки клиентских обращений, анализа данных и автоматизации продаж.

Пример кода:

from agents import Agent, Runner, WebSearchTool, function_tool, guardrail

@function_tool
def submit_refund_request(item_id: str, reason: str):
# Your refund logic goes here
return "success"

support_agent = Agent(
name="Support & Returns",
instructions="You are a support agent who can submit refunds [...]",
tools=[submit_refund_request],
)

shopping_agent = Agent(
name="Shopping Assistant",
instructions="You are a shopping assistant who can search the web [...]",
tools=[WebSearchTool()],
)

triage_agent = Agent(
name="Triage Agent",
instructions="Route the user to the correct agent.",
handoffs=[shopping_agent, support_agent],
)

output = Runner.run_sync(
starting_agent=triage_agent,
input="What shoes might work best with my outfit so far?",
)

Планы на будущее

OpenAI стремится сделать агентов неотъемлемой частью рабочих процессов во всех отраслях, значительно повышая производительность труда. Компания продолжит развивать и углублять интеграции и инструменты для быстрого и удобного создания агентов, анонсируя новые возможности уже в ближайшее время.


P.S. В своём телеграм-канале я заставляю ИИ писать мне код, обозреваю свежие новости технологий, а ещё публикую эти самые новости раньше всех. Регулярно даю глубокую аналитику по отрасли и всем событиям, и рассказываю как создавать собственных ИИ-агентов и приложения с ИИ (и как раз на днях потестирую новые API от OpenAI для агентов). И много других интересных непотребств. Велком!

16 просмотров
0 комментариев
Последние

Комментариев пока нет