Fig. 02.A — pipeline schematic
— No. 02 / Pipeline
YouTube AI Pipeline
podtube-pipeline · 2024 — present
YouTube動画を自動収集 → 文字起こし → AI解析する一連のパイプライン。動画尺で処理モードを自動切替 (全文一括 vs 時間窓)、並列ダウンロード × 直列GPU処理でスループットを最大化。A pipeline that auto-crawls YouTube, transcribes audio and analyses it with an LLM. Switches strategy by video length (full-text vs windowed) and pairs parallel download with serial GPU work to maximise throughput.
Typeデータ取得 · 解析パイプラインIngestion + analysis pipeline
Roleアーキテクチャ · 実装Architecture · Implementation
StackPython · faster-whisper · yt-dlp · Ollama · Gemini · Supabase
Throughput約 60本 / 時 (ローカルRTX環境)~ 60 videos / hour (local RTX env)
Status継続開発中Active development
PythonWhisperOllamaGeminiSupabaseyt-dlp