Realtime voice AI · SIP-native

Диалог в звонке
быстрее оператора.

IAM.Voice — голосовой AI-агент для SIP контакт-центров. Inbound, outbound, дикte mode, barge-in, сценарии. Поверх iam.comm как media-плоскости.

< 600 мс p95 · end-to-end
SIP-native 100+ concurrent streaming ASR barge-in 152-ФЗ · on-prem
p95 < 600 мс FTE ×4 reduction Sovereign · 152-ФЗ
iam-voice / pipeline · live call call_a7f3b1c
SIP
in
VAD
5 мс
ASR
38 мс
NLU + LLM
280 мс
TTS
62 мс
КлиентЗдравствуйте, я по поводу заказа.
АгентПодскажите номер заказа?
КлиентСейчас, минутку, нашёл —
total p95 487 мс concurrent 64 verdict healthy
Сценарии · production patterns

Где Voice заменяет
десятки операторов.

Четыре сценария, в каждом — verified ROI и подтверждённые метрики p95 на проде.

U · 01 · inbound

Inbound service

Приём входящих звонков, идентификация клиента, FAQ, маршрутизация. AHT − 35%, FCR + 18%.

U · 02 · outbound

Outbound campaigns

Информационные и подтверждающие звонки. AMD-фильтр, dynamic dialer, retry-стратегии.

U · 03 · verify

Подтверждение операций

Дозвон с PIN-валидацией, голосовая биометрия (через iam.speech-voiceprint), audit-trail.

U · 04 · tNPS

tNPS / surveys

Звонок-опрос после взаимодействия. Открытые вопросы, эмоциональный анализ, экспорт в BI.

Сценарный движок · graph editor

Сценарий — это граф,
не if-else.

Нативная поддержка barge-in, dictation mode, контекста между ходами. LIFO-стек прерываний для возврата на любой узел.

scenario · order_status_v8.yaml barge-in: on interrupt-stack: 3
welcome
prompt → wait
intent.order
BERT · 0.94
action.lookup
mcp tool
Графовая модель: узлы, ветвления, condition Barge-in: прерывание + LIFO-возврат MCP tools: внешние действия через iam.core
Стек · open + proprietary

ASR, TTS, NLU.
Подменяются по политике.

Нет жёсткого vendor lock-in. Любой ASR-движок, любая модель LLM, любой TTS — через одинаковый адаптер.

01 · ASR

Streaming распознавание

GigaAM RU, Whisper RU/multi, Silero. Streaming partials каждые 100 мс. Custom hotwords и domain LMs.

GigaAM Whisper Silero ASR
02 · NLU + DM

Intent + dialogue management

BERT classifier на интенты + LLM для свободного диалога. RAG для FAQ и базы знаний. Контекст хранится между ходами.

BERT intent LLM dialogue RAG
03 · TTS

Realtime синтез + клонирование

Silero TTS, VKBase, Voice Cloning (с DPO). Низкоприоритетный fallback на оператора, если TTS недоступен.

Silero TTS Voice cloning SSML
Outbound dialer · campaign engine

Кампании на тысячи звонков.
AMD, retry, аналитика — встроены.

Не сторонний dialer и не «звоните в API». Полноценный планировщик с AMD-фильтром, динамическими retry и BI-отчётами.

Кампания
Тип
Контактов
Connect rate
Статус
Подтверждение доставки · NSK
camp_p21d8 · started 10:42
predictive
12 480
71.2 %
running
tNPS · банковская карта
camp_n45ac · started 09:15
power
3 220
64.8 %
running
Информирование · акция
camp_b09f1 · paused 08:30
progressive
28 100
42.1 %
paused
Восстановление доступа
camp_x12d5 · finished 22.05
preview
512
88.4 %
finished
Operator workspace · copilot + handoff

Когда диалог требует
человека — он подключается мгновенно.

Оператор видит транскрипт в реальном времени, подсказки copilot и historical контекст клиента. Handoff из агента в оператора — без обрыва RTP-сессии.

Live transcript AI copilot Seamless handoff Coaching mode Whisper-coach
active call · call_a7f3b1c 02:14
КлиентЗаказ номер 4521…
АгентМинутку, проверяю.
КлиентА когда привезут?
Copilot · suggested
Заказ 4521 в статусе «в пути», ETA — завтра до 14:00. Предложите трекинг-ссылку через SMS.
Pilot · 6–8 недель

Подключим один сценарий
и измерим p95 на ваших звонках.

За четыре недели — поднятый pipeline, ваш сценарий, integration с CRM. Отчёт по AHT, FCR и стоимости звонка через 8 недель.