Hugging Face 감정 분석 - 코딩레이서의 테크허브

# Hugging Face 감정 분석

![Sentiment Analysis](https://images.unsplash.com/photo-1504868584819-f8e8b4b6d7e3?q=80&w=2070&auto=format&fit=crop)

안녕하세요! 오늘은 **Hugging Face Transformers**를 사용해서 감정 분석을 하는 방법을 알아봅니다! 🎭

## 감정 분석이란?

텍스트에서 긍정/부정/중립 감정을 파악하는 NLP 기술입니다.

**예시:**
– “이 제품 정말 좋아요” → 긍정 (0.9)
– “별로 마음에 안 들어요” → 부정 (0.8)
– “그냥 평범해요” → 중립 (0.5)

—

## 1. 환경 설정

“`bash
pip install transformers torch
“`

—

## 2. 간단한 감정 분석

“`python
from transformers import pipeline

# 파이프라인 생성
sentiment_pipeline = pipeline(“sentiment-analysis”)

# 분석 실행
result = sentiment_pipeline(“이 제품 정말 좋아요!”)
print(result)
# [{‘label’: ‘POSITIVE’, ‘score’: 0.9998}]
“`

—

## 3. 한국어 감정 분석

한국어 모델 사용:

“`python
from transformers import pipeline

# 한국어 모델 로드
classifier = pipeline(
“sentiment-analysis”,
model=”sangminlee/deberta-base-korean-sentiment”
)

results = classifier([
“이 영화 정말 재미있어요!”,
“시간 아까워요”,
“그냥 그래요”
])

for result in results:
print(result)
“`

—

## 4. 여러 텍스트 동시 분석

“`python
texts = [
“최고의 서비스입니다!”,
“너무 늦게 왔어요”,
“그냥 평범해요”,
“강력 추천합니다!”,
“다시는 안 이용할게요”
]

results = sentiment_pipeline(texts)

for text, result in zip(texts, results):
label = result[‘label’]
score = result[‘score’]
emoji = “😊” if label == “POSITIVE” else “😞”
print(f”{emoji} {text} ({label}: {score:.2f})”)
“`

—

## 5. 고급 기능

### 감정 점수 세부화

“`python
from transformers import AutoModelForSequenceClassification, AutoTokenizer
import torch

model_name = “cardiffnlp/twitter-roberta-base-sentiment”
model = AutoModelForSequenceClassification.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)

text = “이 제품 사용하기 정말 편해요”

# 토큰화
inputs = tokenizer(text, return_tensors=”pt”)

# 예측
with torch.no_grad():
outputs = model(**inputs)
predictions = torch.nn.functional.softmax(outputs.logits, dim=-1)

# 결과
labels = [“부정”, “중립”, “긍정”]
for label, score in zip(labels, predictions[0]):
print(f”{label}: {score.item():.2%}”)
“`

—

## 6. 웹 앱에 통합

### Flask 백엔드

“`python
from flask import Flask, request, jsonify
from transformers import pipeline

app = Flask(__name__)
classifier = pipeline(“sentiment-analysis”)

@app.route(‘/analyze’, methods=[‘POST’])
def analyze():
data = request.json
text = data.get(‘text’, ”)

result = classifier(text)[0]

return jsonify({
‘label’: result[‘label’],
‘score’: result[‘score’]
})

if __name__ == ‘__main__’:
app.run(debug=True)
“`

—

### React 프론트엔드

“`tsx
import { useState } from ‘react’;

export default function SentimentAnalyzer() {
const [text, setText] = useState(”);
const [result, setResult] = useState(null);

return (

setText(e.target.value)}<br />
        placeholder=”분석할 텍스트 입력…”<br />
      /><br />
      <button onClick={analyze}>분석</button></p>
<p>      {result && (</p>
<div>
<p>감정: {result.label}</p>
<p>확신도: {(result.score * 100).toFixed(1)}%</p>
</p></div>
<p>      )}
    </p></div>
<p>  );<br />
}<br />
“`</p>
<p>—</p>
<p>## 7. 실시간 스트리밍</p>
<p>“`python<br />
from transformers import pipeline<br />
import time</p>
<p>classifier = pipeline(“sentiment-analysis”, device=0)  # GPU</p>
<p>def analyze_stream(text_stream):<br />
    for chunk in text_stream:<br />
        result = classifier(chunk)<br />
        yield result</p>
<p># 사용<br />
texts = [“좋아요”, “정말 좋아요”, “최고예요”]<br />
for result in analyze_stream(texts):<br />
    print(result)<br />
    time.sleep(0.5)<br />
“`</p>
<p>—</p>
<p>## 8. 커스텀 모델 훈련</p>
<p>“`python<br />
from transformers import AutoTokenizer, AutoModelForSequenceClassification, TrainingArguments, Trainer<br />
from datasets import load_dataset</p>
<p># 데이터셋 로드<br />
dataset = load_dataset(“imdb”)</p>
<p># 토크나이저 로드<br />
tokenizer = AutoTokenizer.from_pretrained(“bert-base-uncased”)</p>
<p># 전처리<br />
def tokenize_function(examples):<br />
    return tokenizer(examples[“text”], padding=”max_length”, truncation=True)</p>
<p>tokenized_datasets = dataset.map(tokenize_function, batched=True)</p>
<p># 모델 로드<br />
model = AutoModelForSequenceClassification.from_pretrained(<br />
    “bert-base-uncased”,<br />
    num_labels=2<br />
)</p>
<p># 훈련<br />
training_args = TrainingArguments(<br />
    output_dir=”./results”,<br />
    per_device_train_batch_size=8,<br />
    num_train_epochs=3,<br />
)</p>
<p>trainer = Trainer(<br />
    model=model,<br />
    args=training_args,<br />
    train_dataset=tokenized_datasets[“train”],<br />
    eval_dataset=tokenized_datasets[“test”],<br />
)</p>
<p>trainer.train()<br />
“`</p>
<p>—</p>
<p>## 9. 성능 최적화</p>
<p>### GPU 가속</p>
<p>“`python<br />
classifier = pipeline(“sentiment-analysis”, device=0)  # 첫 번째 GPU<br />
“`</p>
<p>### 배치 처리</p>
<p>“`python<br />
results = classifier(texts, batch_size=32)<br />
“`</p>
<p>### 모델 양자화</p>
<p>“`python<br />
from transformers import pipeline, quantization_config</p>
<p>config = quantization_config(load_in_8bit=True)<br />
classifier = pipeline(<br />
    “sentiment-analysis”,<br />
    model=”bert-base-uncased”,<br />
    quantization_config=config<br />
)<br />
“`</p>
<p>—</p>
<p>## 10. 응용 예시</p>
<p>### 리뷰 감정 분석</p>
<p>“`python<br />
reviews = [<br />
    {“text”: “최고의 제품이에요!”, “rating”: 5},<br />
    {“text”: “별로에요”, “rating”: 1},<br />
]</p>
<p>sentiments = classifier([r[“text”] for r in reviews])</p>
<p>for review, sentiment in zip(reviews, sentiments):<br />
    review[“sentiment”] = sentiment<br />
    print(review)<br />
“`</p>
<p>—</p>
<p>### 소셜 미디어 모니터링</p>
<p>“`python<br />
import tweepy</p>
<p># 트위터 API 설정<br />
auth = tweepy.OAuthHandler(consumer_key, consumer_secret)<br />
auth.set_access_token(access_token, access_token_secret)<br />
api = tweepy.API(auth)</p>
<p># 트윗 가져오기<br />
tweets = api.user_timeline(screen_name=”user”, count=10)</p>
<p># 감정 분석<br />
sentiments = classifier([tweet.text for tweet in tweets])</p>
<p>for tweet, sentiment in zip(tweets, sentiments):<br />
    print(f”{tweet.text}: {sentiment[‘label’]}”)<br />
“`</p>
<p>—</p>
<p>## 결론</p>
<p>Hugging Face는 감정 분석을 쉽게 구현할 수 있는 강력한 도구입니다!</p>
<p>**핵심 포인트:**<br />
– ✅ 사전 훈련된 모델 즉시 사용<br />
– ✅ 다양한 언어 지원<br />
– ✅ 커스텀 훈련 가능<br />
– ✅ GPU 가속 지원</p>
<p>—</p>
<p>## 다음 단계</p>
<p>– 🎯 특정 도메인에 맞는 모델 찾기<br />
– 🔧 커스텀 모델 훈련<br />
– 📊 대규모 데이터 처리</p>
<p>## 참고 자료</p>
<p>– [Hugging Face 문서](https://huggingface.co/docs)<br />
– [Sentiment Analysis Tutorial](https://huggingface.co/tasks/sentiment-analysis)</p>
<p>—</p>
<p>질문이 있나요? 댓글로 남겨주세요! 😊</p>
<p>**다음 포스팅:** Pinecone 벡터 DB 입문</p>
		</div>

<footer class="entry-meta" aria-label="Entry meta">
			<span class="cat-links"><span class="gp-icon icon-categories"><svg viewBox="0 0 512 512" aria-hidden="true" xmlns="http://www.w3.org/2000/svg" width="1em" height="1em"><path d="M0 112c0-26.51 21.49-48 48-48h110.014a48 48 0 0143.592 27.907l12.349 26.791A16 16 0 00228.486 128H464c26.51 0 48 21.49 48 48v224c0 26.51-21.49 48-48 48H48c-26.51 0-48-21.49-48-48V112z" /></svg></span><span class="screen-reader-text">Categories </span><a href="https://codingracer.com/category/it/it_coding/" rel="category tag">Coding</a></span> 		<nav id="nav-below" class="post-navigation" aria-label="Posts">
			<div class="nav-previous"><span class="gp-icon icon-arrow-left"><svg viewBox="0 0 192 512" aria-hidden="true" xmlns="http://www.w3.org/2000/svg" width="1em" height="1em" fill-rule="evenodd" clip-rule="evenodd" stroke-linejoin="round" stroke-miterlimit="1.414"><path d="M178.425 138.212c0 2.265-1.133 4.813-2.832 6.512L64.276 256.001l111.317 111.277c1.7 1.7 2.832 4.247 2.832 6.513 0 2.265-1.133 4.813-2.832 6.512L161.43 394.46c-1.7 1.7-4.249 2.832-6.514 2.832-2.266 0-4.816-1.133-6.515-2.832L16.407 262.514c-1.699-1.7-2.832-4.248-2.832-6.513 0-2.265 1.133-4.813 2.832-6.512l131.994-131.947c1.7-1.699 4.249-2.831 6.515-2.831 2.265 0 4.815 1.132 6.514 2.831l14.163 14.157c1.7 1.7 2.832 3.965 2.832 6.513z" fill-rule="nonzero" /></svg></span><span class="prev"><a href="https://codingracer.com/ai-%eb%aa%a8%eb%8d%b8-%eb%b9%84%ea%b5%90-gpt-vs-claude-vs-gemini/" rel="prev">AI 모델 비교: GPT vs Claude vs Gemini</a></span></div><div class="nav-next"><span class="gp-icon icon-arrow-right"><svg viewBox="0 0 192 512" aria-hidden="true" xmlns="http://www.w3.org/2000/svg" width="1em" height="1em" fill-rule="evenodd" clip-rule="evenodd" stroke-linejoin="round" stroke-miterlimit="1.414"><path d="M178.425 256.001c0 2.266-1.133 4.815-2.832 6.515L43.599 394.509c-1.7 1.7-4.248 2.833-6.514 2.833s-4.816-1.133-6.515-2.833l-14.163-14.162c-1.699-1.7-2.832-3.966-2.832-6.515 0-2.266 1.133-4.815 2.832-6.515l111.317-111.316L16.407 144.685c-1.699-1.7-2.832-4.249-2.832-6.515s1.133-4.815 2.832-6.515l14.163-14.162c1.7-1.7 4.249-2.833 6.515-2.833s4.815 1.133 6.514 2.833l131.994 131.993c1.7 1.7 2.832 4.249 2.832 6.515z" fill-rule="nonzero" /></svg></span><span class="next"><a href="https://codingracer.com/pinecone-%eb%b2%a1%ed%84%b0-db-%ec%9e%85%eb%ac%b8/" rel="next">Pinecone 벡터 DB 입문</a></span></div>		</nav>
				</footer>
			</div>
</article>
		</main>
	</div>

<div class="widget-area sidebar is-right-sidebar" id="right-sidebar">
	<div class="inside-right-sidebar">
		<aside id="block-7" class="widget inner-padding widget_block widget_text">
<p class="has-text-align-center has-medium-gray-color has-text-color has-link-color wp-elements-2cc1e6c1cc8b777e144a6b4a0a18e848">Copyright © 2024 Jack Kim | Powered by Codingracer</p>
</aside><aside id="block-5" class="widget inner-padding widget_block"><div class="wp-block-group"><div class="wp-block-group__inner-container is-layout-flow wp-block-group-is-layout-flow"><h2 class="wp-block-heading">보관함</h2><ul class="wp-block-archives-list wp-block-archives">	<li><a href='https://codingracer.com/2026/02/'>2026년 2월</a></li>
	<li><a href='https://codingracer.com/2025/01/'>2025년 1월</a></li>
	<li><a href='https://codingracer.com/2024/12/'>2024년 12월</a></li>
	<li><a href='https://codingracer.com/2024/11/'>2024년 11월</a></li>
	<li><a href='https://codingracer.com/2024/06/'>2024년 6월</a></li>
	<li><a href='https://codingracer.com/2024/05/'>2024년 5월</a></li>
	<li><a href='https://codingracer.com/2024/04/'>2024년 4월</a></li>
	<li><a href='https://codingracer.com/2024/03/'>2024년 3월</a></li>
</ul></div></div></aside><aside id="block-6" class="widget inner-padding widget_block"><div class="wp-block-group"><div class="wp-block-group__inner-container is-layout-flow wp-block-group-is-layout-flow"><h2 class="wp-block-heading">카테고리</h2><ul class="wp-block-categories-list wp-block-categories">	<li class="cat-item cat-item-28"><a href="https://codingracer.com/category/lifestyle/car-life/">Car Life</a>
</li>
	<li class="cat-item cat-item-27"><a href="https://codingracer.com/category/it/it_coding/">Coding</a>
</li>
	<li class="cat-item cat-item-29"><a href="https://codingracer.com/category/news/">News</a>
</li>
	<li class="cat-item cat-item-25"><a href="https://codingracer.com/category/it/it_os/">OS</a>
</li>
	<li class="cat-item cat-item-32"><a href="https://codingracer.com/category/travel/play/">관광지</a>
</li>
	<li class="cat-item cat-item-30"><a href="https://codingracer.com/category/travel/food/">맛집</a>
</li>
	<li class="cat-item cat-item-1"><a href="https://codingracer.com/category/%eb%af%b8-%eb%b6%84%eb%a5%98/">미분류</a>
</li>
	<li class="cat-item cat-item-31"><a href="https://codingracer.com/category/travel/k_hotel/">호텔리뷰</a>
</li>
</ul></div></div></aside>	</div>
</div>

</div>
</div>

</body>
</html>