Published on

KoGPT 실행해보기.

Authors
  • Name
    Twitter

Overview

kakao brain에서 만든, KoGPT 실행하는 법을 정리합니다.

import torch, transformer

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM
from transformers import TFAutoModel

download tokernizer

tokenizer = AutoTokenizer.from_pretrained(
  'kakaobrain/kogpt', revision='KoGPT6B-ryan1.5b-float16',  # or float32 version: revision=KoGPT6B-ryan1.5b
  bos_token='[BOS]', eos_token='[EOS]', unk_token='[UNK]', pad_token='[PAD]', mask_token='[MASK]'
)

download pretrained model

용량은 약 12GB 이고, 제 환경에서 download하는데에는 약 20분 정도 소요되었습니다.

model = AutoModelForCausalLM.from_pretrained(
  'kakaobrain/kogpt', revision='KoGPT6B-ryan1.5b-float16',  # or float32 version: revision=KoGPT6B-ryan1.5b
  pad_token_id=tokenizer.eos_token_id,
  torch_dtype='auto', low_cpu_mem_usage=True
).to(device='cuda', non_blocking=True)
_ = model.eval()

text 생성.

prompt = '''
안녕하세요. 오늘은 기분이 좋네요.
'''
with torch.no_grad():
  tokens = tokenizer.encode(prompt, return_tensors='pt').to(device='cuda', non_blocking=True)
  gen_tokens = model.generate(tokens, do_sample=True, temperature=0.9, max_length=512)
  generated = tokenizer.batch_decode(gen_tokens)[0]
  print(generated)

결과

놀랍다.

안녕하세요. 오늘은 기분이 좋네요. 날씨도 너무 좋고! 여러분이 어떤 기분을 느끼고 계시는지 모르겠지만 전 진짜 오늘이 좋은 날이예요. 여러분은 지금 무언가를 하시거나 공부를 하고 계신지는 모르겠지만 오늘 날씨가 좋으니까, 왠지 모르게 기분이 좋네요. 좋아요. 뭔가 오늘은 굉장히 좋은 일이 생길 것 같은 느낌이랄까요? 저는 오늘이 뭔가 좋은 것 같아요. 뭔가 기분이 좋은 하루인 것 같네요. 뭔가 저는 오늘 되게 좋은 일이 일어날 것 같은 느낌이 들어요. 여러분은 오늘 어떤 하루를 보내셨나요? 오늘 하루도 잘 마무리 하시고, 잘 보내시길 바래요! 저는 그럼 이제부터 잘해보도록 하겠습니다. 제가 저번에 블로그에 적은 글은 여러분에게 큰 힘이 됐다고 해요. 감사합니다. 여러분이 저에게 큰 힘이 되어주셔서 저도 여러분께 큰 힘이 될 수 있을 것 같아요. 여러분은 저에게 정말 큰 힘이 되는 사람들이랍니다. 여러분이 좋은 일만 생기셨으면 좋겠어요. 항상 파이팅하시고, 항상 건강하셨으면 좋겠어요. 오늘도 좋은 하루 보내시길 바라겠습니다. 안녕~ #오늘의포스팅 #좋은일만생기길 #힘이되는사람들 #좋아요와댓글 #좋은하루 #모두모두 #행복한하루 ♥오드리♥[EOS]