Gemini API로 문서 처리 기능 살펴보기

Gemini API는 전달된 PDF 문서에서 추론을 처리하고 실행할 수 있습니다. PDF가 업로드되면 Gemini API는 다음 작업을 실행할 수 있습니다.

  • 콘텐츠에 관한 질문을 설명하거나 답변
  • 콘텐츠를 요약하세요.
  • 콘텐츠에서 추론

이 튜토리얼에서는 제공된 PDF 문서로 Gemini API를 프롬프트하는 몇 가지 방법을 보여줍니다. 모든 출력은 텍스트로만 표시됩니다.

다음 단계

이 가이드에서는 generateContent를 사용하고 처리된 문서에서 텍스트 출력을 생성하는 방법을 보여줍니다. 자세한 내용은 다음 리소스를 참고하세요.

  • 파일 프롬프트 전략: Gemini API는 텍스트, 이미지, 오디오, 동영상 데이터를 사용한 프롬프트를 지원합니다. 이를 멀티모달 프롬프트라고도 합니다.
  • 시스템 안내: 시스템 안내를 사용하면 특정 요구사항 및 사용 사례에 따라 모델의 동작을 조정할 수 있습니다.
  • 안전 가이드: 생성형 AI 모델이 부정확하거나 편향적이거나 불쾌감을 주는 출력과 같은 예상치 못한 출력을 생성하는 경우가 있습니다. 이러한 출력으로 인한 피해 위험을 최소화하기 위해서는 후처리와 사람의 평가가 필수적입니다.