LocalTranscribeの仕組み

ファイルがプライベートに保たれる方法についての技術的な説明。

ブラウザ内処理

LocalTranscribeはウェブブラウザ内で完全に動作します。ファイルを読み込むと、ファイルはデバイス上に留まり、AIによる文字起こしはWebAssemblyベースのモデルを使用してローカルで実行されます。音声データ、ファイルの内容、文字起こし結果がサーバーに到達することは一切ありません。

技術的な実装

ローカル文字起こしを可能にする具体的な技術:

Transformers.js

JavaScriptを使用してブラウザ上でWhisper AIモデルを直接実行します。バックエンドサーバーなしで最先端の機械学習を可能にします。

Whisper(ONNX Runtime Web経由)

OpenAIのWhisper音声認識モデル。WebAssemblyにコンパイルされ、ONNX Runtime経由でブラウザ内で実行されます。実際の文字起こしを行うエンジンです。

FFmpeg.wasm

FFmpegのWebAssemblyビルド。動画ファイルから音声トラックを抽出し、フォーマット変換を処理するために使用されます。すべてデバイス上で実行されます。

File API

ブラウザの組み込みFile APIがファイルをローカルでメモリに読み込みます。コンテンツを読み込むためのネットワークリクエストは一切発生しません。

SharedArrayBuffer & Web Workers

FFmpeg.wasmとMLモデルはバックグラウンドスレッド(Web Workers)で動作し、SharedArrayBufferを使用して効率的にメモリを共有します。これにより、文字起こし中もUIの応答性が維持されます。

プライバシーへの影響

  • ファイルはサーバーにアップロードされません
  • 音声コンテンツはネットワークエンドポイントに到達しません
  • 文字起こし結果はデバイス上にのみ生成・保存されます
  • ファイル名、長さ、メタデータは記録・送信されません
  • 第三者はあなたが文字起こしした内容にアクセスできません

確認方法

ご自身で確認することができます:

  1. ブラウザの開発者ツールを開きます(F12またはページを右クリック→検査)。
  2. 「ネットワーク」タブに移動します。
  3. ファイルを読み込み、文字起こしを開始します。
  4. ネットワークタブを見てください — ファイルデータを含むリクエストは表示されません。

ページ読み込み後にインターネットを切断することもできます。文字起こしは引き続き動作します。

トレードオフ

処理がデバイス上で行われるため、文字起こし速度はCPUと使用可能なメモリに依存します。古い、または処理能力の低いデバイスはサーバーベースのツールより時間がかかります。非常に大きなファイル(2GB超)は、一部のデバイスでメモリ不足を引き起こす可能性があります。

プライベートに文字起こしする準備はできましたか?

今すぐファイルを文字起こしする