Aikoの操作手順@リアルマニュアル

作成日2024年7月14日  更新日2025年2月8日
動作を確認した環境
iPhone SE、iPhone 15。iOS 17.5.1。
  1. 文字起こしの対象となる音声ファイルを保存
    たとえば、ボイスメモの音声を「ファイル」に保存するには
    1. ボイスメモを開き、文字起こししたいタイトルをダブルタップし、右スワイプして「その他の操作」でダブルタップします。
    2. 「共有・ボタン」と読み上げたら、ダブルタップします。
    3. 音声ファイルのタイトルが読み上げられ、右スワイプしていくと、「閉じる」「オーディオ録音」、その容量などが読み上げられます。
    4. さらに右スワイプして、「コピー」「複製」「よく使う項目」「フォルダに移動」「新規クイックメモ」と移動して、「”ファイル”に保存」でダブルタップします。
    5. 前回保存した場所が開くので、そこでよければ、右スワイプして「保存」をダブルタップします。
    6. あるいは、「戻る・ボタン」「ブラウズ・ボタン」で保存場所を選択できる「ブラウズ・見出し」まで戻り、右スワイプして、保存したい場所を選んで、保存します。
    7. 「ブラウズ」画面を、右スワイプすると、すでにどこかに保存していれば、「最近使った項目」として、自分で作ったフォルダが並んでいます。
    8. さらに、保存できる「場所」として、「このiPhone内」「OneDrive」「iCloudDrive」「ドライブ」などが並んでいます。
    9. 適当な場所やフォルダまで移動して、画面上部の右端にある「保存」ボタンでダブルタップすると、ボイスメモ「戻る・ボタン」と読み上げ、この時点で、ボイスメモの音声ファイルが、適当なフォルダに保存されます。
  2. Aikoアプリ使用上の注意点
    AppStoreでAikoをインストールします
    • ボタン表記や説明はすべて英語なので、読み上げ速度を少し遅めにしておくと、聞き取りやすいでしょう。
    • もちろん、VoiceOverの操作そのものは日本語で、その合間に、ボタンや説明が英語で読み上げられるだけなので、あまり構えずに。
    • インストールが終わり「入手」をダブルタップすると、「Welcome to Aiko」という挨拶に始まって、英語で案内があります。
  3. 「Welcome to Aiko」以下の内容
    その日本語訳を記しておきます。
    • アイコへようこそ。
    • このアプリはAIを使用して、デバイス上でローカルに高品質の文字起こしを行います。これには多くのリソースが必要であり、時間がかかる場合があります。
    • Whisper AIモデルにもいくつかの欠陥があります。たとえば、オーディオに無音部分が多い場合、音声が途切れて繰り返してしまう可能性があります。詳細については、Web サイトを参照してください。
  4. 準備が整いました。
    実際の操作方法をふた通り記します。
    1. 一つは、文字起こししたものをメモ帳にペーストする手順。
    2. もう一つは、さらに詳しい手順の説明。
  5. 一つ目の、メモ帳にペーストする手順
    まず、「Welcome to Aiko」と読み上げたら
    1. 右スワイプしていって、「OK」ボタンをダブルタップします。
    2. 右スワイプで移動して、「Settings」「New Transcription」「Open」「Record」のうち、「Open」でダブルタップします。
    3. 「ファイル」アプリが開くので、文字起こしをしたい音声ファイルを探してダブルタップします。
    4. この時点で、Aikoの画面に戻り、「Settings・無効」と読み上げる以外、何も言いませんが、すでに文字起こしが始まっています。
    5. 右スワイプすると、進捗状況がパーセント表示で読み上げられます。数時間の録音でも数分で終わります。
    6. 文字起こしが終了すると「Japanese」と読み上げ、どんどん右スワイプして、「Copy」でダブルタップすると、文字起こしをした文章すべてがコピーされます。
    7. メモアプリやメールアプリなどを開けて、ローターで編集を選び、上下スワイプで「ペースト」を選んでダブルタップすると、文字起こしした文章が貼り付けられます。
    8. ペーストの方法として、メモアプリやメールアプリなどの画面上でダブルタップ&ホールドをして、左右スワイプで「ペースト」を選び、ダブルタップするというやり方もあります。
    9. コピペしたあとも、文字起こしの結果は、画面上に表示されています。画面下部を4本指でタッチして、右端にある「More(もっと見る)」をダブルタップし、右スワイプで「Clear Transcription(文字起こしの消去)」まで移動したら、ダブルタップします。
    10. これで、表示されていた文字起こしの文章が消去されて、ホーム画面に戻り、右スワイプしてみると、上記02と同じように読み上げます。
  6. 二つ目の操作手順は、もう少し細く説明します。
    「Welcome to Aiko」と読み上げたら
    1. 右スワイプしていって、「OK」ボタンをダブルタップ。一つ目と同じです。
    2. すぐに「Settings」と読み上げるので、ダブルタップして、右スワイプし、先頭近くで「Audio language Auto-detect」と読み上げたら、ダブルタップし、頭文字がJのところまで、右スワイプして、「Japanese」でダブルタップします。
    3. 上記の英語部分を翻訳すると、Aikoの「設定」画面で、「音声言語は自動検出」となっているのを、「日本語」にしたことになります。
    4. 自動検出のままでも、さほど支障はなさそうです。
    5. スクラブで、ホーム画面に戻ります。
  7. ホーム画面にどんなボタンがあるか、右スワイプで移動して確認
    「Settings」「New Transcription」「Open」「Record」この四つだけです。
    • 日本語訳すると、「設定」「新規文字起こし」「開く」「録音」ということです。
    • 音声ファイルを取り込んで文字起こしをするには、「Open」ボタンをダブルタップします。
    • 直接録音しながら文字起こしをするには、「Record」ボタンをダブルタップします。
    • 「New Transcription」については、後述します。
  8. 「Open」をダブルタップすると
    「ファイル」アプリが開きます。
    • 文字起こしをしたい音声ファイルを探してダブルタップすると、Aikoの画面に戻り、「Settings・無効」と読み上げ、文字起こしが始まります。
    • つまり、文字起こしを開始したという音声はありませんが、文字起こしをしている間は、「Settings」ボタンは使えず、さらに右スワイプすると、進捗状況がパーセント表示で読み上げられます。
  9. 文字起こしが終了すると
    右スワイプで「Japanese」と読み上げます
    • そこで左スワイプすると「Settings」、さらに右スワイプすると、「Record Audio」「New Transcription」のあと、文字起こしした文章が読み上げられます。
    • 複数人による会話ですと発話者ごとに区切られて表示されます。
    • さらに右スワイプすると「Tool Bar・Find(ツールバー・検索)」「Copy(コピー)」「Export(出力)」「More(もっと見る)」と読み上げます。
    • 対象となる文が長いと、文字起こしをした文章の次に「Vertical Scroll Bar(垂直スクロールバー)」も表示されます。
  10. 「Copy」をダブルタップすると
    文字起こした文章すべてがコピーされます
    • そこで、メモアプリやメールアプリなどを開けて、ペーストします。
    • ペーストの二通りの方法を、再度、記しておきます。
      1. ローターで編集を選び、上下スワイプで「ペースト」を選んでダブルタップ。
      2. 画面上でダブルタップ&ホールドをして、左右スワイプで「ペースト」を選び、ダブルタップ。
  11. また、「Export」でダブルタップし
    さらに「Share」でダブルタップすると
    • 誰と共有するか、どこに保存するかなどを選ぶ画面になります。
    • 「Share」でダブルタップせずに、さらに右スワイプすると、「Export As」つまり、どんな形式で出力するかを、次の中から選べます。
      • SRT(Subtitles)(SRT方式の字幕ファイル)
      • WebVTT(Subtitles)(WebVTT方式の字幕ファイル)
      • CSV(カンマ区切りのデータファイル)
      • JASON(JASON方式のファイル)
      • TEXT with Timestamps(タイムスタンプ付きのテキストファイル)
      • Text(テキストファイル)の六種類です。
    • 聞き覚えのある「CSV」にすると、Excelで操作するのに便利です。
    • また、「TEXT with Timestamps」にすると、文を適当な長さで区切って、その時々のタイムスタンプが併記されます。
    • 指定しないと、「Text」で出力されます。
  12. 「Record」を使うと、Aikoで直接録音してすぐに文字起こしをすることができます。
    初めて「Record」でダブルタップすると、Aikoでマイクを使う許可を求められます。
    • マイクへのアクセスを許可する手順は以下の通りです。
      1. 「アクセス許可」ないしは「Grant Access」をダブルタップします。
      2. iPhone本体の「設定」が開き、「Aikoに戻る」と読み上げます。
      3. 右スワイプで、「設定・戻る・ボタン」「Aiko」「AIKOにアクセスを許可」「写真」「マイク」「Siriと検索」と移動できます。
      4. その中の「マイク」でダブルタップします。
      5. 「切り替えオン」と読み上げたら、画面上部の左端をタップし、「Aikoに戻る」をダブルタップします。
    • もう一度「Record」でダブルタップすると、すでに録音が始まっていますが、何も読み上げません。
    • 録音を終えたいと思ったら、二回、右スワイプして、ダブルタップすると、録音は終わり、即座に、文字起こしが始まります。
    • その際、「Aiko Settings・無効」と読み上げ、しばらくすると文字起こしが終了します。
  13. 余談ですが
    録音が始まったかどうかわからず、無言のままでいたら、その後、次のように文字起こししました。
    • 「次回はお会いしましょう。」「ご視聴ありがとうございました。ご視聴ありがとうございました。」「では、さようなら。最後まで視聴してくださってありがとうございました」などなど。
    • 「Welcome to Aiko」の中で述べられていた、文字起こしのための「Whisper AI」というAIのバグのようです。先日、新聞に「AIの空耳?」というコラムがありました。
    • その新聞記事に触れた個人ブログをご紹介します。「AIの空耳」かぁ。
  14. 「New Transcription」について記します
    「New Transcription(新規文字起こし)」をダブルタップし
    1. 右スワイプしていくと、「Import File」「Import Video from Photo Library」「Record Audio」「Paste」と読み上げます。
    2. 「Import File」は、「Open」と同じ操作ができます。
    3. 「Record Audio」は、「Record」と同じ操作ができます。
    4. 「Import Video from Photo Library」は、iPhoneの写真ライブラリーが開いてビデオ一覧が表示され、そこから文字起こししたいビデオを選びます。
    5. また、最後の「Paste(ペースト)」は、iPhone内にある音声ファイルをコピーしてから、ダブルタップすると、文字起こしが始まります。音声ファイルがコピーされていないと、「Paste」は使えません。
    6. あらかじめ、ボイスメモの音声ファイルを保存しておかなくても、ファイルをコピーして、Aikoの「Paste」を選べば、すぐに文字起こしの処理に移ることができるわけですが、処理したあとで、音声ファイルと聴き比べしながら、文字起こしテキストを修正するには、あらかじめどこかに保存しておいたほうが、使いやすいでしょう。
  15. 画面下部右端の「More」について説明します
    画面下部右端をタッチし、「More(もっと見る)」と読み上げたらダブルタップすると
    • コンテキストメニューが開き、文字起こしをした文章情報と消去ボタンが表示されています。
    • 右スワイプすると、「Words」「Characters」「Processing Time」、つまり、単語数、文字数、文字起こしの処理にかかった時間が読み上げられます。
    • コンテキストメニューの最後に、「一つ目」のほうでも触れたように、画面に表示された文字起こしの文章を消去する「Clear Transcription」ボタンがあります。
    • ここでダブルタップして文章を消去しておくと、次にAikoを開けたときに、操作ボタンが四つしかない、シンプルなホーム画面が開きます。

以上で、Aikoの操作マニュアルは終わりです。