ファイルがプライベートに保たれる方法についての技術的な説明。

ブラウザ内処理

LocalTranscribeはウェブブラウザ内で完全に動作します。ファイルを読み込むと、ファイルはデバイス上に留まり、AIによる文字起こしはWebAssemblyベースのモデルを使用してローカルで実行されます。音声データ、ファイルの内容、文字起こし結果がサーバーに到達することは一切ありません。

技術的な実装

ローカル文字起こしを可能にする具体的な技術：

JavaScriptを使用してブラウザ上でWhisper AIモデルを直接実行します。バックエンドサーバーなしで最先端の機械学習を可能にします。

OpenAIのWhisper音声認識モデル。WebAssemblyにコンパイルされ、ONNX Runtime経由でブラウザ内で実行されます。実際の文字起こしを行うエンジンです。

FFmpegのWebAssemblyビルド。動画ファイルから音声トラックを抽出し、フォーマット変換を処理するために使用されます。すべてデバイス上で実行されます。

ブラウザの組み込みFile APIがファイルをローカルでメモリに読み込みます。コンテンツを読み込むためのネットワークリクエストは一切発生しません。

FFmpeg.wasmとMLモデルはバックグラウンドスレッド（Web Workers）で動作し、SharedArrayBufferを使用して効率的にメモリを共有します。これにより、文字起こし中もUIの応答性が維持されます。

ご自身で確認することができます：

ページ読み込み後にインターネットを切断することもできます。文字起こしは引き続き動作します。

処理がデバイス上で行われるため、文字起こし速度はCPUと使用可能なメモリに依存します。古い、または処理能力の低いデバイスはサーバーベースのツールより時間がかかります。非常に大きなファイル（2GB超）は、一部のデバイスでメモリ不足を引き起こす可能性があります。

プライベートに文字起こしする準備はできましたか？