
プロジェクトの背景と概要
本プロジェクトは、AIによって生成された記事の文脈に合った画像を自動生成し、記事をより魅力的にするプラットフォームの開発です。ユーザーがアップロードした画像を適切な位置に挿入することも可能です。
顧客が直面していた課題
- 記事の文脈との関連性: ChatGPT 3.5が画像認識に対応していなかったため、AIが記事の内容を理解し、最適な画像の挿入位置を判断する必要があった。
- 処理パフォーマンス: ローカルモデルを使用する場合、CPUでの画像生成速度が遅く、リソース消費が大きいという課題があった。
提案した解決策とアプローチ
- Frontend: ReactJS, TailwindCSS を使用。
- Backend: NodeJS, Python (FastAPI), SQS を使用。
- Database: PostgreSQL を採用し、データストレージと管理を行う。
- AI/ML: プロンプトエンジニアリングを活用し、画像生成と挿入位置の決定を1回で完了させる手法を採用。Image captioning技術を用いて、アップロードされた画像の意味を解釈し、ChatGPTに入力条件として渡すことで適切な位置選択を実現。
- Infrastructure / DevOps: AWS EC2, S3, Lambda を使用し、Auto Scaling Group による自動スケーリングと、VPC, NAT Gateway, Bastion Hostによるセキュリティ強化を実施。
導入技術と得られた成果
- 画像生成時間を10秒以内に短縮し、CPUのみで3枚の画像を生成可能となった。
- コンテンツクリエイターの手作業負荷を軽減し、時間節約に貢献。
- 定義された美的基準に基づいた一貫した画像品質を実現。
- Webへの画像共有を容易にした。

English