Голосовой ввод и диктовка: как превратить речь в текст в Obsidian и не только

В эпоху цифровых заметок голосовой ввод становится всё более востребованным: речь позволяет быстро фиксировать мысли «на ходу», не отвлекаясь на печатание.

Особенно это актуально для продуктивности и личной работы – например, когда вы слушаете лекцию или размышляете о прочитанном и хотите не потерять мгновенную идею.

Ниже разберём популярные методы диктовки, их плюсы и минусы, сценарии использования и интеграции с Obsidian.

Сравнение инструментов голосового ввода (резюме)

Инструмент / сервис	Простота использования	Платформа	Интеграция с Obsidian
iOS диктовка	очень просто (клавиатура)	iPhone/iPad	встроенный Clipboard, Shortcuts
Android диктовка	очень просто (клавиатура)	Android	приложения-перехватчики, Shortcuts
Сторонние клавиатуры	средняя (нужна установка)	Android/iOS (Gboard/Yandex)	не напрямую
Telegram (боты/премиум)	просто (отправил голосовое)	iOS/Android/Web (Telegram)	через плагин Telegram Sync
Siri/Shortcuts	просто (универсально)	iOS/macOS	Shortcuts для Obsidian URI
Windows dictation	очень просто (Win+H)	Windows 10/11	работaет в любом приложении
macOS диктовка	просто (Fn дважды)	MacOS	работает в любых полях
Google Docs Voice	легко (Chrome Tools)	Windows/macOS/Linux (Chrome)	экспорт в Markdown через Copy
Расширения (Voice In)	просто (Chrome ext.)	Любая ОС (Chrome)	ввод в любом поле браузера
Приложения (Speechnotes, др.)	просто (старт)	Windows/macOS/Android	вручную копировать/передать
Otter.ai	средняя (регистрация)	Web/iOS/Android	можно экспортить текст
Whisper (CLI/сервис)	средняя (командная строка)	Любая (Python/CLI)	через скрипты или плагины
NotebookLM (Google)	средняя (веб-сервис)	Web	нет прямой, можно скармливать текст
Whisper API (плагин)	просто (установить, API)	Obsidian	встроенный плагин
GPT Assistant (плагин)	просто (установить, API)	Obsidian	генерирует ответы по заметкам
Telegram Sync (плагин)	просто (бот+токен)	Obsidian	сохраняет голосовые и текст

📱 Мобильный ввод

1️⃣ Встроенные функции:

На смартфонах и планшетах большинство клавиатур имеют кнопку микрофона — достаточно коснуться её и начать говорить.

Система сама определит конец фразы (или нажмите «Готово»).

Голосовой ввод на iOS и Android поддерживает русский язык и обычную пунктуацию (скажите «точка», «запятая» и т.п.).

✔️ Плюсы:

всегда под рукой,
не требует сторонних приложений,
хорошо подходит для быстрых заметок.

🔴 Минусы:

нужно поправлять пунктуацию или форматировать текст голосом;
фразы воспринимаются буквально (иначе получается «speech to text» без разделения на главы).

Один участник нашего чата заметил:

«В аудиофайле заметку не увидишь – не пробежишь глазами, не найдёшь нужное».

То есть при диктовке сразу в текст вы теряете аудиозапись, но получаете текст, который можно искать и связывать.

2️⃣ Сторонние клавиатуры (Gboard, Яндекс и др.).

Google-клавиатура (Gboard) и другие позволяют тоже диктовать голосом.

Настройка:

добавьте нужную раскладку (русскую) и нажмите микрофон на клавиатуре.
Поддерживают дополнительные голосовые команды и чаще акцентированы на точность (Yandex.Клавиатура, например, оптимизирована под русский).
Это просто и знакомо большинству пользователей, хотя технически тут нет тесной интеграции с Obsidian – текст придётся скопировать.

3️⃣ Telegram-боты и сообщения

На ходу можно послать голосовое самому себе или боту в Telegram. Ранее, мы обсуждали синхронизацию Telegram-бота, который позволяет отправлять текст или аудио прямо в хранилище вашего Obsidian. Посмотрите здесь, способы синхронизации Obsidian

🎙️ Если у вас включена «Транскрипция голосовых сообщений» в Telegram Premium, под каждым голосовым станет кнопка «Текст»: по ней получим готовую стенограмму.

В чате разработчиков Obsidian советуют ещё один сценарий:

записать сообщение на iPhone (например, «Диктофоном»),
переслать в Telegram,
бот/плагин автоматически транскрибирует его.

Например, Telegram Sync плагин может автоматически сохранять текст голосовых сообщений (с платной Premium-транскрипцией) в файлы заметок. Такой подход удобен, если вы уже активно пользуетесь Telegram для заметок.

4️⃣ Shortcuts (Siri, Google Assistant).

iOS и Android имеют голосовых ассистентов (Siri, Google).

Можно, например, создать Shortcuts:

включить «Голосовой ввод» как действие в Shortcut, чтобы нажатием кнопки или голосом («Siri, продиктуй заметку Obsidian») сразу записать текст в заметку.
В Obsidian есть даже пользовательские решения: через Advanced URI можно вызвать создание новой заметки и вставку текста.
Для Android схожая схема: Google Assistant можно попросить «Записать заметку [текст]», а потом экспортировать в Obsidian.

💻 Десктопный ввод (на компьютере)

1️⃣ Google Docs – Диктовка

В браузере Chrome откройте Google Docs,
выберите в меню Инструменты → Голосовой ввод.
Появится микрофон: нажмите его и говорите.
Google Cloud Speech-to-Text поддерживает русский (код ru-RU), так что речь транскрибируется с хорошей точностью.

✔️ Плюсы:

часто работает даже через плохой микрофон,
умеет пунктуацию,
бесплатен (до лимита).

Минусы:

только в браузере,
нужно интернет, и надо потом скопировать текст в Obsidian (либо синхронизировать через свой метод).

Простой пример:

диктуете целый черновик статьи или лекции, а затем переносите результат в Markdown.

2️⃣ Диктовка в macOS

На Mac в Системных настройках → Клавиатура → Диктовка включите функцию, выберите язык «Русский».

Диктовка запускается двойным нажатием Fn (или другой назначенной клавишей).
После этого можно говорить любые заметки.

✔️ Достоинство:

работает во всех приложениях (включая Obsidian),
поддерживает команды «запятая», «точка» и некоторые действия (удалить это, новый абзац и т.д.).

Один пользователь отметил:

в macOS можно добиться очень точного распознавания: главное – выбрать русский язык в настройках.

🔴 Минусы:

тоже требует подключения к интернету
действует голосовая команда «Начать диктовать». (В macOS есть и офлайн-режим «улучшенная диктовка», но он хуже понимает русский.)

3️⃣ Встроенный голосовой ввод Windows.

В Windows 10/11 есть система диктовки: достаточно поставить курсор в текстовое поле и нажать сочетание Win+H.

Появится окно голосового ввода, говорите – слова появятся в документе. Windows 11 официально поддерживает русский язык диктовки.

✔️Преимущества:

работает в любом приложении, даже в Obsidian (любом текстовом редакторе).

🔴 Недостатки:

иногда некорректно ставит точки и запятые,
для «прекратить» надо сказать «Закончить прослушивание» или нажать кнопку.

🤖 Специализированные приложения

1️⃣ Speechnotes

(онлайн-блокнот и Android-приложение)

О приложении:

Speechnotes использует технологии Google и поддерживает русский. На сайте или в приложении можно сразу диктовать заметку – всё автоматически сохранится.

✔️ Его плюс:

фокус на диктовке (есть команды пунктуации, автоматическое исправление),
можно бесплатно.

🔴 Минус:

надо копировать текст из браузера в Obsidian.
Аналогично с расширением Voice In – Speech-To-Text для Chrome: оно добавляет голосовой ввод на любой сайт.

По данным разработчиков, Voice In позволяет «диктовать без клавиатуры по-русски» более чем на 10 000 сайтах, включая Google Docs, Gmail, ChatGPT и т.д.. Это очень удобно, если вы часто печатаете из браузера: говорите в любое поле ввода.

2️⃣ Whisper (CLI и сервисы).

OpenAI Whisper – бесплатная модель для расшифровки аудио. Она поддерживает русский язык и замечательно распознаёт речь с шумами и акцентами.

Можно запустить Whisper у себя (есть Python-клиент, Docker, «Whisper.cpp» для офлайн) или воспользоваться сторонними сервисами (например, сервера на базе Faster-Whisper).

3️⃣ Wispr Flow – AI-клавиатура-диктовщик

Wispr Flow — это приложение на iOS, macOS и Windows, которое превращает вашу речь в текст в любом поле ввода, включая Obsidian, браузеры, мессенджеры, IDE, почтовые клиенты и другие инструменты

✔️ Плюсы:

Работает везде: Obsidian, Telegram, VS Code, Gmail и др.
Быстрее печати в 3–4 раза (Flow обещает ~220 слов/мин против ~45 печатных)
Обрабатывает речь локально + AI‑команды + авто‑редактирование текста
Обещают надёжную приватность: данные не используются для тренировки ИИ, пока ты явно не включил это

🔴 Минусы / замечания:

Инсталляция весит около 800 МБ, потребляет CPU ≈ 8% даже в простое, и постоянно работает в фоне (подключается к автозапуску)
Пользователи жалуются на внедрение в контекстные меню, мониторинг приложений (Firefox/Chrome), отсутствие прозрачности по сбору данных
Есть вопросы по безопасности: неизвестно, как и что именно передаётся, нет чётких границ

⭐ В Obsidian доступны плагины и скрипты: например, плагин Whisper API позволяет вести запись прямо в заметке или загружать аудиофайл, а он создаёт транскрипт.

Это мощный способ: вы просто говорите – и текст автоматически формируется.

Главное

– учесть, что большие аудиозаписи придётся обрабатывать дольше.

Whisper выгоден тем, что многоязычен и офлайн (если установить локальную модель).

Комбинировать подход?

Так, например, можно комбинировать:

быстрый голос в путь, а точные формулировки – диктуйте подольше.
Кому-то удобнее писать руками, а кто-то получает поток мыслей именно в устной речи.

Проводите эксперименты: попробуйте разные плагины и сервисы, чтобы найти свой баланс скорости и точности.

Главное – чтобы ваш голос стал помощником в заметках, а не помехой.

🌍 Что советуют эксперты и техноблоги

Если верить обзорам, список выглядит так:

Rev — топ по качеству транскрибации
Dragon Anywhere — безумно точный, но дорогой
Descript — идеален для видео и подкастов
Google Voice Typing / Word диктовка — для ленивых, но быстро
Speechnotes / Braina Pro — недооценённые, но удобные

💬 Что выбирают у нас, в Obsidian & Mind Club

🥇 Wispr Flow — безумно быстрый, почти как мысль

«Вставляется в любую программу. Работает как магия».
«Пишу в Obsidian голосом и не парюсь».
— Участники клуба

Плюсы: универсальный, работает везде, офигенно точный
Минусы: жрёт ресурсы, постоянно в фоне, трогает браузеры

🥈 Telegram Sync + Whisper или Premium диктовка

«Надиктовал — получил заметку. Просто. Удобно.»

Плюсы: нативно, мобильно, интеграция с Obsidian
Минусы: Telegram не всегда стабилен, требует привыкания

🥉 Whisper CLI / API / плагины

«Whisper — это ChatGPT, только для звука. Работает, даже когда всё остальное тупит».

Плюсы: работает оффлайн, точность на высоте
Минусы: требует навыков, не для новичков

🏅 Siri Shortcuts + Obsidian URI

«Сказал — создалось».
«Приватность на максимум. Все мысли — внутри устройства».

Плюсы: автономно, без интернета, кастомно
Минусы: только iOS, нужно настроить Shortcut

Идем дальше?

🗃️ Шаблоны в Obsidian — примеры и как их создавать

⬅️ Назад на главную

Elton Labs

Голосовой ввод и диктовка: как превратить речь в текст в Obsidian и не только

Сравнение инструментов голосового ввода (резюме)

📱 Мобильный ввод

1️⃣ Встроенные функции:

2️⃣ Сторонние клавиатуры (Gboard, Яндекс и др.).

3️⃣ Telegram-боты и сообщения

4️⃣ Shortcuts (Siri, Google Assistant).

💻 Десктопный ввод (на компьютере)

1️⃣ Google Docs – Диктовка

2️⃣ Диктовка в macOS

3️⃣ Встроенный голосовой ввод Windows.

🤖 Специализированные приложения

1️⃣ Speechnotes

2️⃣ Whisper (CLI и сервисы).

3️⃣ Wispr Flow – AI-клавиатура-диктовщик

⭐ В Obsidian доступны плагины и скрипты: например, плагин Whisper API позволяет вести запись прямо в заметке или загружать аудиофайл, а он создаёт транскрипт.

Комбинировать подход?

🌍 Что советуют эксперты и техноблоги

💬 Что выбирают у нас, в Obsidian & Mind Club

🥇 Wispr Flow — безумно быстрый, почти как мысль

🥈 Telegram Sync + Whisper или Premium диктовка

🥉 Whisper CLI / API / плагины

🏅 Siri Shortcuts + Obsidian URI

3️⃣ Wispr Flow – AI-клавиатура-диктовщик