お客様から相談を受けたり、自分自身が「あったらな」と必要に迫られて作成したツールなどをご紹介します。
Here, I’ll introduce tools that I’ve created either in response to customer requests or out of my own need—things I thought, “It would be great if this existed.”
ショート動画自動生成ツール
Short video auto-generation tool
動画の元ネタ(テキストorPDF)などを渡すと、生成AIを活用して「ナレーション音声」、「シーン画像」、「字幕」を自動生成し、1本のショート動画として合成するツール
特徴は以下です。
動画編集ソフトを使わずに、コマンド一つで「字幕あり動画」、「字幕なし動画、「字幕データ(SRT)」のセットが完成します。
TVコマーシャルのようなCMモード、ElevenLabsのVoiceを指定できるなど、様々な工夫が施されています。
自動作成された動画が気に入らない場合は、特定のナレーション音声・シーン画像の変更、ストーリー展開、音声の再生速度の変更などが簡単にできます。
また、最新のマルチモーダルモデル(例えば、gemini-3-pro-image-preview)を指定して、Interleavedモードも活用できますので、シーン間の整合性が確保された動画の作成ができます。
これまでの動画制作では、台本をもとにした音声収録、適切な画像や素材の収集、そして動画編集ソフトを使った緻密なタイムライン調整(音声と画像・字幕の同期など)に、膨大な時間と専門的なスキルが不可欠でした。
私は、世間で騒がれているような生成AIを活用した簡易的な動画制作ツールを複数、活用してきましたが、私にとっては何れも期待外れでした。
簡易的な動画制作ツールでは、完全おまかせモードはありますが、完成後の動画の修正ができない。できても編集の手間がかかる。日本語音声がイマイチ。読みを正しく発話しない。等々、色々な課題が残されたままです。
しかし、本ツールを活用することで、煩雑な作業工程を大幅に自動化・短縮することができます。テキストや資料を用意するだけで、誰でも直感的に高品質なショート動画を量産できるようになるため、以下のような幅広いシーンで強力な武器となります。
SNSマーケティング:
YouTube Shorts、TikTok、Instagram Reels向けコンテンツの高速な生成
YouTube Shorts、TikTok、Instagram Reels向けコンテンツの高速な生成
広告クリエイティブ:
CMモードと多様なボイスを活かした、プロモーション動画の大量制作
CMモードと多様なボイスを活かした、プロモーション動画の大量制作
教育・研修コンテンツ:
テキストベースのマニュアルや解説資料の、より分かりやすい動画制作の補助
テキストベースのマニュアルや解説資料の、より分かりやすい動画制作の補助
クリエイターの負担を最小限に抑えつつ、AIの力でアイデアを即座に形にできる「次世代の動画生成」を目指して開発したツールです。
This tool takes source material (text or PDF) and uses generative AI to automatically generate “narration audio,” “scene images,” and “subtitles,” then combines them into a single short video.
Its features are as follows:
Without using video editing software, a single command generates a complete set consisting of a “video with subtitles,” a “video without subtitles,” and “subtitle data (SRT).”
It includes various features, such as a “commercial mode” for TV-style ads and the ability to specify ElevenLabs Voice.
If you don’t like the automatically generated video, you can easily change specific narration voices or scene images, adjust the story progression, or modify the playback speed of the audio.
Additionally, by specifying the latest multimodal models (such as gemini-3-pro-image-preview) and utilizing Interleaved mode, you can create videos with consistent continuity between scenes.
In traditional video production, a tremendous amount of time and specialized skills were essential for voice recording based on a script, gathering appropriate images and materials, and meticulous timeline adjustments using video editing software (such as synchronizing audio with images and subtitles).
I have tried several of the simple video creation tools utilizing generative AI that have been making headlines, but for me, they were all disappointing.
While these simplified video production tools offer a fully automated mode, they often do not allow for post-production editing. Even when editing is possible, it is labor-intensive. Japanese voiceovers are subpar, and the pronunciation is often incorrect. These and other issues remain unresolved.
However, by utilizing this tool, you can significantly automate and shorten these cumbersome workflows. By simply preparing text and reference materials, anyone can intuitively mass-produce high-quality short videos, making it a powerful asset in a wide range of scenarios, such as:
Social Media Marketing:
Rapid generation of content for YouTube Shorts, TikTok, and Instagram Reels
Advertising Creatives:
Mass production of promotional videos utilizing the CM mode and a diverse range of voices
Educational and Training Content:
Assistance in creating more understandable videos from text-based manuals and explanatory materials
This tool was developed with the goal of achieving “next-generation video generation” that instantly brings ideas to life using AI, while minimizing the burden on creators.
生成AIを活用した設計図面からの加工時間・費用の見積り
Estimating Machining Time and Costs from Design Drawings Using Multimodal Models
--- 工事中 ---
--- Under Construction ---