[ChatGPT4.0] pdf 이미지 파일 내 표 읽고 그래프 만들기

최근 챗지피티와 같은 생성형 AI들의 능력이 날로 고도화되고있다. 특히 코드/쿼리를 짜준다든지 요약해준다든지 하는 기능 뿐만 아니라 유료화 버전들의 경우에는 이미지, 자료들을 불러와 읽을 수 있다.

이 중에는 OCR이라 불리는 광학문자인식(optical character recognition) 기능이 좋아보이는데 이번엔 pdf 파일 내 표를 인식해서 그래프를 그려보라고 해보자.

여기서는 챗지피티가 잘 안되면 단계를 나눠서 해보는 것이 핵심이다.

아래 자료를 보자

4페이지에 있는 해당 테이블을 시각화하고 싶다고 가정하고 진행해보았다.

  • [jd

    파일을 읽히고 작업을 원하는 위치를 알려준다. 이때 설명은 되도록 구체적이면 좋다. 나의 경우 table 1이라는 단어와 Comparision of 2015 and 2020 KDRIs for water 라는 테이블 명을 명시했다. GPT는 해당 테이블을 성공적으로 불러왔다.

    파일을 읽히고 작업을 원하는 위치를 알려준다. 이때 설명은 되도록 구체적이면 좋다. 나의 경우 table 1이라는 단어와 Comparision of 2015 and 2020 KDRIs for water 라는 테이블 명을 명시했다. GPT는 해당 테이블을 성공적으로 불러왔다.

    2. (선택) 해당 테이블에 대해 설명하고, 인사이트를 말하라고 해보자. 이 질문을 하는 이유는 GPT가 해당 테이블을 제대로 설명하고 있는지에 대해서 검증하고자 함인데, 여기서 다른 이야기를 하는 경우도 있으니 이 때는 추가설명을 통해서 보정을 해주어야 한다.

    3. 이제 시각화를 지시한다. 여기서 문제가 발생했다. 네 번의 시도를 거쳤지만 해당 테이블에 대해 성공적으로 시각화하는 것에 실패했다.

    4. 이러면 바로 포기하지말고 단계를 하나 더 삽입해주자. 챗지피티는 기본적으로 이러한 작업을 할 때 파이썬 코드를 자체적으로 구동해서 구현해주기때문에 이 단계를 내가 한 번 더 지시를 통해 구체화시켜주면 된다. 한 번 시각화를 할 수 있게 끔 파이썬 데이터 프레임으로 만들어달라고 하자. 그러면 아래와 같이 작업을 진행한다. 일단 윗 차례에서 해당 테이블에 대한 설명을 해달라고 했을 때, 이미 해당 이미지에 대한 읽기는 가능하다는 것을 의미하기 때문에 데이터프레임으로 제작해달라고 하는 것은 어렵지 않다.

    내갸 지시한 내용을 자체적으로 코드를 만들어 진행하는 모습

    5. 해당 데이터 프레임을 토대로 시각화를 해달라고 하자. 한번의 실수 이후에 성공적으로 그래프화에 성공했다.