- 動作を確認した環境
- iPhone SE、iPhone 15。iOS 17.5.1。
-
文字起こしの対象となる音声ファイルを保存
- たとえば、ボイスメモの音声を「ファイル」に保存するには
-
- ボイスメモを開き、文字起こししたいタイトルをダブルタップし、右スワイプして「その他の操作」でダブルタップします。
- 「共有・ボタン」と読み上げたら、ダブルタップします。
- 音声ファイルのタイトルが読み上げられ、右スワイプしていくと、「閉じる」「オーディオ録音」、その容量などが読み上げられます。
- さらに右スワイプして、「コピー」「複製」「よく使う項目」「フォルダに移動」「新規クイックメモ」と移動して、「”ファイル”に保存」でダブルタップします。
- 前回保存した場所が開くので、そこでよければ、右スワイプして「保存」をダブルタップします。
- あるいは、「戻る・ボタン」「ブラウズ・ボタン」で保存場所を選択できる「ブラウズ・見出し」まで戻り、右スワイプして、保存したい場所を選んで、保存します。
- 「ブラウズ」画面を、右スワイプすると、すでにどこかに保存していれば、「最近使った項目」として、自分で作ったフォルダが並んでいます。
- さらに、保存できる「場所」として、「このiPhone内」「OneDrive」「iCloudDrive」「ドライブ」などが並んでいます。
- 適当な場所やフォルダまで移動して、画面上部の右端にある「保存」ボタンでダブルタップすると、ボイスメモ「戻る・ボタン」と読み上げ、この時点で、ボイスメモの音声ファイルが、適当なフォルダに保存されます。
-
Aikoアプリ使用上の注意点
- AppStoreでAikoをインストールします
-
- ボタン表記や説明はすべて英語なので、読み上げ速度を少し遅めにしておくと、聞き取りやすいでしょう。
- もちろん、VoiceOverの操作そのものは日本語で、その合間に、ボタンや説明が英語で読み上げられるだけなので、あまり構えずに。
- インストールが終わり「入手」をダブルタップすると、「Welcome to Aiko」という挨拶に始まって、英語で案内があります。
-
「Welcome to Aiko」以下の内容
- その日本語訳を記しておきます。
-
- アイコへようこそ。
- このアプリはAIを使用して、デバイス上でローカルに高品質の文字起こしを行います。これには多くのリソースが必要であり、時間がかかる場合があります。
- Whisper AIモデルにもいくつかの欠陥があります。たとえば、オーディオに無音部分が多い場合、音声が途切れて繰り返してしまう可能性があります。詳細については、Web サイトを参照してください。
-
準備が整いました。
- 実際の操作方法をふた通り記します。
-
- 一つは、文字起こししたものをメモ帳にペーストする手順。
- もう一つは、さらに詳しい手順の説明。
-
一つ目の、メモ帳にペーストする手順
- まず、「Welcome to Aiko」と読み上げたら
-
- 右スワイプしていって、「OK」ボタンをダブルタップします。
- 右スワイプで移動して、「Settings」「New Transcription」「Open」「Record」のうち、「Open」でダブルタップします。
- 「ファイル」アプリが開くので、文字起こしをしたい音声ファイルを探してダブルタップします。
- この時点で、Aikoの画面に戻り、「Settings・無効」と読み上げる以外、何も言いませんが、すでに文字起こしが始まっています。
- 右スワイプすると、進捗状況がパーセント表示で読み上げられます。数時間の録音でも数分で終わります。
- 文字起こしが終了すると「Japanese」と読み上げ、どんどん右スワイプして、「Copy」でダブルタップすると、文字起こしをした文章すべてがコピーされます。
- メモアプリやメールアプリなどを開けて、ローターで編集を選び、上下スワイプで「ペースト」を選んでダブルタップすると、文字起こしした文章が貼り付けられます。
- ペーストの方法として、メモアプリやメールアプリなどの画面上でダブルタップ&ホールドをして、左右スワイプで「ペースト」を選び、ダブルタップするというやり方もあります。
- コピペしたあとも、文字起こしの結果は、画面上に表示されています。画面下部を4本指でタッチして、右端にある「More(もっと見る)」をダブルタップし、右スワイプで「Clear Transcription(文字起こしの消去)」まで移動したら、ダブルタップします。
- これで、表示されていた文字起こしの文章が消去されて、ホーム画面に戻り、右スワイプしてみると、上記02と同じように読み上げます。
-
二つ目の操作手順は、もう少し細く説明します。
- 「Welcome to Aiko」と読み上げたら
-
- 右スワイプしていって、「OK」ボタンをダブルタップ。一つ目と同じです。
- すぐに「Settings」と読み上げるので、ダブルタップして、右スワイプし、先頭近くで「Audio language Auto-detect」と読み上げたら、ダブルタップし、頭文字がJのところまで、右スワイプして、「Japanese」でダブルタップします。
- 上記の英語部分を翻訳すると、Aikoの「設定」画面で、「音声言語は自動検出」となっているのを、「日本語」にしたことになります。
- 自動検出のままでも、さほど支障はなさそうです。
- スクラブで、ホーム画面に戻ります。
-
ホーム画面にどんなボタンがあるか、右スワイプで移動して確認
- 「Settings」「New Transcription」「Open」「Record」この四つだけです。
-
- 日本語訳すると、「設定」「新規文字起こし」「開く」「録音」ということです。
- 音声ファイルを取り込んで文字起こしをするには、「Open」ボタンをダブルタップします。
- 直接録音しながら文字起こしをするには、「Record」ボタンをダブルタップします。
- 「New Transcription」については、後述します。
-
「Open」をダブルタップすると
- 「ファイル」アプリが開きます。
-
- 文字起こしをしたい音声ファイルを探してダブルタップすると、Aikoの画面に戻り、「Settings・無効」と読み上げ、文字起こしが始まります。
- つまり、文字起こしを開始したという音声はありませんが、文字起こしをしている間は、「Settings」ボタンは使えず、さらに右スワイプすると、進捗状況がパーセント表示で読み上げられます。
-
文字起こしが終了すると
- 右スワイプで「Japanese」と読み上げます
-
- そこで左スワイプすると「Settings」、さらに右スワイプすると、「Record Audio」「New Transcription」のあと、文字起こしした文章が読み上げられます。
- 複数人による会話ですと発話者ごとに区切られて表示されます。
- さらに右スワイプすると「Tool Bar・Find(ツールバー・検索)」「Copy(コピー)」「Export(出力)」「More(もっと見る)」と読み上げます。
- 対象となる文が長いと、文字起こしをした文章の次に「Vertical Scroll Bar(垂直スクロールバー)」も表示されます。
-
「Copy」をダブルタップすると
- 文字起こした文章すべてがコピーされます
-
- そこで、メモアプリやメールアプリなどを開けて、ペーストします。
- ペーストの二通りの方法を、再度、記しておきます。
-
- ローターで編集を選び、上下スワイプで「ペースト」を選んでダブルタップ。
- 画面上でダブルタップ&ホールドをして、左右スワイプで「ペースト」を選び、ダブルタップ。
-
また、「Export」でダブルタップし
- さらに「Share」でダブルタップすると
-
- 誰と共有するか、どこに保存するかなどを選ぶ画面になります。
- 「Share」でダブルタップせずに、さらに右スワイプすると、「Export As」つまり、どんな形式で出力するかを、次の中から選べます。
-
- SRT(Subtitles)(SRT方式の字幕ファイル)
- WebVTT(Subtitles)(WebVTT方式の字幕ファイル)
- CSV(カンマ区切りのデータファイル)
- JASON(JASON方式のファイル)
- TEXT with Timestamps(タイムスタンプ付きのテキストファイル)
- Text(テキストファイル)の六種類です。
- 聞き覚えのある「CSV」にすると、Excelで操作するのに便利です。
- また、「TEXT with Timestamps」にすると、文を適当な長さで区切って、その時々のタイムスタンプが併記されます。
- 指定しないと、「Text」で出力されます。
-
「Record」を使うと、Aikoで直接録音してすぐに文字起こしをすることができます。
- 初めて「Record」でダブルタップすると、Aikoでマイクを使う許可を求められます。
-
- マイクへのアクセスを許可する手順は以下の通りです。
-
- 「アクセス許可」ないしは「Grant Access」をダブルタップします。
- iPhone本体の「設定」が開き、「Aikoに戻る」と読み上げます。
- 右スワイプで、「設定・戻る・ボタン」「Aiko」「AIKOにアクセスを許可」「写真」「マイク」「Siriと検索」と移動できます。
- その中の「マイク」でダブルタップします。
- 「切り替えオン」と読み上げたら、画面上部の左端をタップし、「Aikoに戻る」をダブルタップします。
- もう一度「Record」でダブルタップすると、すでに録音が始まっていますが、何も読み上げません。
- 録音を終えたいと思ったら、二回、右スワイプして、ダブルタップすると、録音は終わり、即座に、文字起こしが始まります。
- その際、「Aiko Settings・無効」と読み上げ、しばらくすると文字起こしが終了します。
-
余談ですが
- 録音が始まったかどうかわからず、無言のままでいたら、その後、次のように文字起こししました。
-
- 「次回はお会いしましょう。」「ご視聴ありがとうございました。ご視聴ありがとうございました。」「では、さようなら。最後まで視聴してくださってありがとうございました」などなど。
- 「Welcome to Aiko」の中で述べられていた、文字起こしのための「Whisper AI」というAIのバグのようです。先日、新聞に「AIの空耳?」というコラムがありました。
- その新聞記事に触れた個人ブログをご紹介します。「AIの空耳」かぁ。
-
「New Transcription」について記します
- 「New Transcription(新規文字起こし)」をダブルタップし
-
- 右スワイプしていくと、「Import File」「Import Video from Photo Library」「Record Audio」「Paste」と読み上げます。
- 「Import File」は、「Open」と同じ操作ができます。
- 「Record Audio」は、「Record」と同じ操作ができます。
- 「Import Video from Photo Library」は、iPhoneの写真ライブラリーが開いてビデオ一覧が表示され、そこから文字起こししたいビデオを選びます。
- また、最後の「Paste(ペースト)」は、iPhone内にある音声ファイルをコピーしてから、ダブルタップすると、文字起こしが始まります。音声ファイルがコピーされていないと、「Paste」は使えません。
- あらかじめ、ボイスメモの音声ファイルを保存しておかなくても、ファイルをコピーして、Aikoの「Paste」を選べば、すぐに文字起こしの処理に移ることができるわけですが、処理したあとで、音声ファイルと聴き比べしながら、文字起こしテキストを修正するには、あらかじめどこかに保存しておいたほうが、使いやすいでしょう。
-
画面下部右端の「More」について説明します
- 画面下部右端をタッチし、「More(もっと見る)」と読み上げたらダブルタップすると
-
- コンテキストメニューが開き、文字起こしをした文章情報と消去ボタンが表示されています。
- 右スワイプすると、「Words」「Characters」「Processing Time」、つまり、単語数、文字数、文字起こしの処理にかかった時間が読み上げられます。
- コンテキストメニューの最後に、「一つ目」のほうでも触れたように、画面に表示された文字起こしの文章を消去する「Clear Transcription」ボタンがあります。
- ここでダブルタップして文章を消去しておくと、次にAikoを開けたときに、操作ボタンが四つしかない、シンプルなホーム画面が開きます。
以上で、Aikoの操作マニュアルは終わりです。