自然言語処理で感情分析システムを作る方法【日本語テキスト対応】

はじめに
感情分析の基本
日本語感情分析の実装
大量テキストの効率的な処理
製造業での活用事例
精度を上げるための工夫
よくある質問
まとめ

はじめに

感情分析（センチメント分析）はSNS・レビュー・カスタマーサポートで需要が高いNLPタスクです。日本語の感情分析をHugging FaceのTransformersを使って実装する手順を解説します。製造業のMLエンジニアとして顧客フィードバック分析に活用してきた経験から、実践的な方法を紹介します。

感情分析の基本

感情分析はテキストを「ポジティブ・ネガティブ・ニュートラル」または5段階の感情スコアに分類するタスクです。レビューサイトの自動分類・SNSのブランドモニタリング・カスタマーサポートの優先度付けなどに活用されます。日本語の感情分析は英語より難しく、敬語・俗語・文脈依存表現への対応が課題です。

日本語感情分析の実装

Hugging FaceのTransformersライブラリを使った日本語感情分析の実装例を示します。

from transformers import pipeline, AutoModelForSequenceClassification, AutoTokenizer

# 日本語感情分析モデルのロード
model_name = "koheiduck/bert-japanese-finetuned-sentiment"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)

# パイプラインの作成
sentiment_analyzer = pipeline(
    "sentiment-analysis",
    model=model,
    tokenizer=tokenizer
)

# 感情分析の実行
texts = [
    "この製品はとても使いやすくて満足しています",
    "品質が悪くてがっかりしました",
    "普通の製品です"
]

for text in texts:
    result = sentiment_analyzer(text)
    print(f"テキスト: {text}")
    print(f"感情: {result[0]['label']}, スコア: {result[0]['score']:.3f}")
    print()

大量テキストの効率的な処理

import pandas as pd
from tqdm import tqdm

def analyze_batch(texts, batch_size=32):
    results = []
    for i in tqdm(range(0, len(texts), batch_size)):
        batch = texts[i:i+batch_size]
        batch_results = sentiment_analyzer(batch)
        results.extend(batch_results)
    return results

# CSVからレビューを読み込んで一括分析
df = pd.read_csv("reviews.csv")
df["sentiment"] = analyze_batch(df["review_text"].tolist())
df["label"] = df["sentiment"].apply(lambda x: x["label"])
df["score"] = df["sentiment"].apply(lambda x: x["score"])
df.to_csv("reviews_with_sentiment.csv", index=False)

製造業での活用事例

顧客からの製品フィードバック（メール・チャット・アンケート）を感情分析することで、ネガティブなフィードバックを自動的に優先度高で担当者に割り振るシステムを構築しました。処理時間が手動分類の10分の1になり、重要なクレームへの対応速度が向上しました。また月次のネガティブフィードバック率をKPIとして設定することで、製品品質改善の定量的な指標として活用できます。

精度を上げるための工夫

汎用モデルの精度が不十分な場合は自社データでファインチューニングすることで精度が大幅に向上します。ラベル付きデータが100〜1,000件あればfine-tuningが現実的です。前処理（URLの除去・絵文字の正規化・口語表現の変換）で精度が改善されることが多いです。ネガティブ判定されたテキストを抽出して定性的に確認することで、モデルの弱点が把握できます。

よくある質問

「日本語の感情分析で使えるモデルは何がありますか」という質問をよく受けます。Hugging Faceのohoshi/bert-base-japanese-sentiment・koheiduck/bert-japanese-finetuned-sentimentなどが日本語感情分析モデルとして利用できます。「感情分析をAPIとして公開するにはどうすればいいですか」という質問については、FastAPIを使ったRESTful APIに上記のコードを組み込み、DockerコンテナでAWSまたはGCPにデプロイすることで実現できます。

まとめ

日本語感情分析はHugging FaceのTransformersを使えば数十行のコードで実装できます。製造業の顧客フィードバック分析・Eコマースのレビュー分類・SNSモニタリングという用途で即座に価値を発揮できます。まずHugging Faceで日本語対応のsentiment-analysisモデルをダウンロードして動かしてみることが最初のステップです。

💼 ITエンジニア転職特化