<-Блог
3 мин

Теперь с дневником можно разговаривать голосом

Человек говорит в телефон — голос превращается в запись дневника

Идёшь по улице, в голове крутится мысль — и не хочется её терять. Раньше надо было остановиться, достать телефон, открыть приложение, набрать большими пальцами на ходу. Половина пропадала, пока пальцы догоняли мысль.

Теперь — просто жмёшь кнопку микрофона, говоришь, отпускаешь. Запись уже в дневнике, бот её понял, ответил.

Это главное, что мы добавили на этой неделе в «Мой AI Дневник»: голосовые сообщения. До одной минуты. Бесплатно. В App Store и RuStore — уже.

Почему мы вообще это сделали

Потому что попросили. В приложении есть форма обратной связи — туда месяцами приходило одно и то же: «дайте голос». Кто-то пишет быстрее голосом, чем пальцами. Кому-то проще думать вслух. Кто-то ведёт дневник в машине, в метро, на прогулке с собакой — и клавиатура там лишняя.

Я сам, когда начал пробовать фичу ещё на стадии теста, удивился, насколько это меняет привычку. Текстом ты невольно редактируешь себя в голове, подбираешь формулировки. Голосом — говоришь, как думаешь. Сыро, с паузами, с «ну, короче». И ровно это оказывается самым честным материалом для дневника.

Как это работает

На экране, где ты обычно пишешь боту, появилась кнопка микрофона. Зажимаешь — говоришь — отпускаешь. Запись до минуты.

Приложение превращает голос в текст. Качество, как показывает практика, высокое — и не случайно: мы специально взяли ИИ-модель, заточенную под русскую речь. Не универсальную «для всех языков сразу», а ту, которая хорошо слышит именно русский — с его падежами, интонацией, сложными именами и словами, где ударение не там, где ждёшь. Английские слова вперемешку с русскими — тоже ок. Если где-то всё-таки ошиблось, можно поправить перед отправкой.

А дальше бот отвечает — так же, как на любое обычное текстовое сообщение. С памятью, с контекстом, с продолжением того, о чём вы говорили вчера.

Бот слышит не только слова

Вот что мне кажется самым интересным.

Перевод голоса в текст — это не только про то, что именно ты говоришь. Заодно ловится настроение: по тону, по скорости речи, по паузам. Говоришь «всё нормально» спокойно — это одно. Говоришь «всё нормально» с напряжением, на выдохе, чуть быстрее обычного — это другое. Бот это замечает.

Поэтому ответы получаются точнее. Текстом человек может соврать себе, что всё хорошо. Голосом — сложнее.

Это не значит, что бот видит тебя насквозь и выводит на чистую воду. Это значит, что он чуть внимательнее к тому, как ты на самом деле сейчас. И реагирует не на слова, а на состояние.

Про приватность — коротко

У нас жёсткое правило: твои данные остаются у тебя.

Поэтому голосовые работают так. Аудио не хранится у нас на серверах — после того, как голос превратился в текст, сама запись уничтожается. Распознавание речи — наша собственная модель, она работает у нас. Мы не отправляем твой голос в Google, в OpenAI, ни в какие внешние сервисы. И никакого «мы используем данные для улучшения моделей» — нет, не используем.

Это базовый принцип приложения: дневник с памятью, и эта память принадлежит тебе, а не нам.

Где попробовать

Голосовые уже работают — открой aidiary.ru, установи приложение или обнови, если оно у тебя уже стоит:

- App Store - RuStore

Фича бесплатная.

Если ты в числе тех, кто просил добавить голос — спасибо. Фича реально появилась потому, что вы нас допинали.

А если ещё нет — открой приложение, зажми микрофон и скажи первое, что в голове. Это странно звучит, но быстрее всего привычка заводится с какой-нибудь ерунды. Не с «опишу своё состояние», а с «ну, короче, я иду домой и думаю вот о чём».

Потом посмотришь, как бот ответит. И поймёшь, стоит ли этим пользоваться дальше.