๐ Upstage Solar Pro
https://www.upstage.ai/blog/en/solar-pro
Solar Pro: The most intelligent LLM on a single GPUโsupporting more tasks, languages, and domains
Excelling in structured text understanding and domain expertise, Solar Pro tackles complex tasks, multilingual needs, and high-stakes industries.
www.upstage.ai
Upstage(์ ์คํ ์ด์ง) ๋ ์ง๋ 2024๋ 11์ 26์ผ, solar-pro ๋ชจ๋ธ์ ๊ณต์ ์ถ์ํ์ต๋๋ค. ํ๋ผ๋ฏธํฐ ๊ฐ์๊ฐ 22B(220์ต) ๊ฐ ์ด๊ณ Context ๊ธธ์ด๋ 32,768 ์ ๋๋ค. ์์ด, ํ๊ตญ์ด, ์ผ๋ณธ์ด๋ฅผ ์ง์ํ๋ฉฐ 2024๋ 5์๊น์ง์ ๋ฐ์ดํฐ๋ก ํ์ต๋์๋ค๊ณ ํฉ๋๋ค.
solar ๋ ํนํ, HTML ๋ฐ Markdown๊ณผ ๊ฐ์ ๊ตฌ์กฐํ๋ ํ์์ ์ ์ฒ๋ฆฌํ ์ ์๋๋ก ์ค๊ณ๋ LLM ์ ๋๋ค. Upstage ์ Document Parse ๋ชจ๋ธ์ ํตํด ๋ฌธ์๋ฅผ ๊ตฌ์กฐํ ํ์ฌ ์ถ์ถํ๊ณ , ์ด๋ฅผ Solar ์ ์ ์ฉํ ๋ ๊ฐ์ ์ด ์๋ ๋ชจ๋ธ์ธ๋ฐ์. ๊ทธ๋์ OpenAI์ gpt-4o ๋ชจ๋ธ๊ณผ ๋น๊ตํ์ ๋ ์ด๋ค ๋ต๋ณ์ ์ฐจ์ด๊ฐ ์๋ ์ง ์ดํด๋ณด๊ณ ์ ํฉ๋๋ค.
https://console.upstage.ai/docs/capabilities/chat
Upstage Console
Empower your business with Upstage Console.
console.upstage.ai

์ ๋ API๋ฅผ ์ฌ์ฉํ์ฌ Solar-pro ๋ชจ๋ธ์ ํตํ ๋ต๋ณ ์์ฑ ํ ์คํธ๋ฅผ ์งํํ์ต๋๋ค. Upstage์ API Key๋ฅผ ๋ฐ๊ธ๋ฐ๊ณ , ์ ์์ ์ฝ๋๋ฅผ ํตํด ์ฝ๊ฒ ์ฌ์ฉ์ด ๊ฐ๋ฅํฉ๋๋ค.
๐ช Upstage Document Parse
https://console.upstage.ai/docs/capabilities/document-parse
Upstage Console
Empower your business with Upstage Console.
console.upstage.ai
๋ฌธ์ ๊ธฐ๋ฐ์ ๋ต๋ณ ์์ฑ์ ์ํด, Upstage Document Parse ๋ชจ๋ธ๋ก ๋ฌธ์ ๋ด ํ ์คํธ๋ฅผ HTML ํ์์ผ๋ก ์ถ์ถํฉ๋๋ค. Document Parse ๋ PDF, JPEG, PNG, BMP, TIFF, HEIC, DOCX, PPTX, XLSX ํ์์ ๋ฌธ์๋ฅผ HTML๋ก ๋ณํํ๋ AI ๋ชจ๋ธ์ ๋๋ค. ๋จ๋ฝ, ํ, ์ด๋ฏธ์ง ๋ฑ์ ๋ ์ด์์ ์์๋ฅผ ๊ฐ์งํ์ฌ ๋ฌธ์์ ๊ตฌ์กฐ๋ฅผ ํ์ ํ๋ ๊ฒ์ด ํน์ง์ธ๋ฐ์. ๊ฐ๋ น, ๊ฐ์ ํ์ ๋๊ฐ ์ด์์ ๋จ๋ฝ์ด ์๋๋ผ๋, ํ ์คํธ๊ฐ ํจ๊ป ์ถ์ถ๋์ง ์๋๋ก ๋ ์ด์์์ ๊ตฌ๋ถํ ์ถ์ถ์ด ๊ฐ๋ฅํ๋ค๋ ๊ฒ์ ๋๋ค. ์ด๋ฌํ ํน์ง์ ๊ฐ์ง๊ณ ์๊ธฐ์ ํ๊ฐ ๋ง๊ฑฐ๋ ๋จ๋ฝ์ด ์ฌ๋ฌ๊ฐ๋ก ์ชผ๊ฐ์ง ๋ฌธ์์ ์ฌ์ฉํ๊ธฐ์ ์ข์ต๋๋ค.
๋ช๊ฐ์ง ์์ ๋ฅผ ์ ์ฉํด๋ณด๋ฉด์, ์ถ์ถ ๊ฒฐ๊ณผ๋ฅผ ํ์ธํด๋ณด์์ต๋๋ค.
1. table(ํ)


2. list(๋ชฉ๋ก)


3. heading1(์ ๋ชฉ1)


์ด๋ ๊ฒ ๋ฌธ์ ๋ด ํด๋น ์์ญ์ ์์น, ์ข ๋ฅ์ ๋ฐ๋ผ Category๊ฐ ๋ฌ๋ผ์ง๋ฉฐ, HTML ํ์์ผ๋ก ์ถ์ถ๋๋ ๊ฒ์ ํ์ธํ ์ ์์ต๋๋ค. ์ด 12 ๊ฐ์ Category ๊ฐ ์ถ์ถ๋ ์ ์์ผ๋ฉฐ ์๋์ ๊ฐ์ต๋๋ค.

๐ Using Solar Pro for Document QA
๊ทธ๋ผ ์ด์ , Document Parse ๋ฅผ ํตํด ์ถ์ถํ HTML์ LLM์ ๋ฃ์ด ์ง๋ฌธ์ ๋ํ ๋ต๋ณ์ ์งํํด๋ณด๋ ค ํฉ๋๋ค. ์ด๋ฏธ Upstage์ ๋ฐ๋ฅด๋ฉด, solar ๋ชจ๋ธ์ DocumentQA ๋ฐ Table QA ๋ฒค์น๋งํฌ ๋ฐ์ดํฐ๋ฅผ ๋ค์ํ LLM ๋ชจ๋ธ์ ์ ์ฉํ์ฌ ๋น๊ตํ์์ ๋, ๊ฐ์ฅ ์ข์ ์ฑ๋ฅ์ ๋์ ํ์ธํ ์ ์์์ต๋๋ค.

๊ทธ๋ ์ง๋ง ์ค์ ๋ก ์์ฑ๋ ๊ฒฐ๊ณผ๋ฅผ ์ฌ๋์ด ํ์ธํ์ ๋ ์ด๋ค ์ฐจ์ด๊ฐ ๋๊ปด์ง๋ ์ง, ๋๊ฐ์ด ์ ๋ต์ ๋งํ์ ๋๋ ๋ต๋ณ ๋ด์ฉ์ ์ฐจ์ด๊ฐ ์กด์ฌํ ์ง ์ดํด๋ณด๊ณ ์ ํฉ๋๋ค.
Example 1 - PDF, Table

<table id='319' style='font-size:16px'><tr><td>ํ์ฌ๋ช </td><td colspan="3">ํ์ฌ ์ฃผ์ ๊ฐ์</td></tr><tr><td rowspan="3">World Economic Forum</td><td>WORLD ECONOMIC FORUM</td><td colspan="2">- ์ธ๊ณ๊ฒฝ์ ํฌ๋ผ(World Economic Forum, WEF)์ ๋งค๋ ์ค์์ค ๋ค๋ณด์ค(Davos)์์ ์ด๋ฆฌ๋ ์ฐ๋กํ์ฌ๋ก, ์ ์ธ๊ณ ์ฃผ์ ๋ฆฌ๋๋ค์ด ๊ธ๋ก๋ฒ ๊ฒฝ์ , ์ฌํ, ์ ์น, ๊ธฐ์ ์ ๋์ ๊ณผ์ ๋ฅผ ๋ ผ์ - 2025๋ ์ฐ๋กํ์ฌ๋ '์ง๋ฅ์๋์ ํ์ (Collaboration for the Intelligent Age)'์ด๋ผ๋ ์ฃผ์ ๋ฅผ ๋ค๋ฃธ * 5๊ฐ ์ธ๋ถ์ฃผ์ : ์ ๋ขฐ ๊ตฌ์ถ, ์ฑ์ฅ์ ๋ค์ ์์, ์ธ๊ฐ์ ๋ํ ํฌ์, ์ง๊ตฌ๋ฅผ ๋ณดํธ, ์ง๋ฅ์๋์ ์ฐ์ </td></tr><tr><td>๊ธฐ๊ฐ</td><td>์ฅ์</td><td>ํํ์ด์ง</td></tr><tr><td>2025.1.20~24</td><td>์ค์์ค, ๋ค๋ณด์ค</td><td>
https://www.weforum.org/
meetings/world-economic-forum- annual-meeting-2025/</td></tr><tr><td rowspan="3">CES</td><td>CES</td><td colspan="2">- CES(Consumer Electronics Show)๋ ๋งค๋ 1์ ๋ฏธ๊ตญ ๋ผ์ค๋ฒ ์ด๊ฑฐ์ค์์ ๊ฐ์ต๋๋ ์ธ๊ณ ์ต๋์ ๊ฐ์ ๋ฐ IT ์ ์ํ - CES 2025์์๋ AI, ์ง์๊ฐ๋ฅ์ฑ, ์คํํธ์ , ๋์งํธ ํฌ์ค, ์ค๋งํธํ, ๊ตํต, ๋ชจ๋น๋ฆฌํฐ ๋ฑ ์ต์ ๊ธฐ์ ํธ๋ ๋๊ฐ ์๊ฐ๋ ์์ - ํนํ, ์ด๋ฒ ํ์ฌ์์๋ ๋ชจ๋น๋ฆฌํฐ, ์์ ์ปดํจํ ๋ฑ์ ์ ์์ ํ๋ก๊ทธ๋จ์ด ์ ๋ณด์ผ ์์ </td></tr><tr><td>๊ธฐ๊ฐ</td><td>์ฅ์</td><td>ํํ์ด์ง</td></tr><tr><td>2025.1.7~10</td><td>๋ฏธ๊ตญ, LA</td><td>
https://www.ces.tech/
</td></tr><tr><td rowspan="3">AAAI-25</td><td>Association for the Advancement of Artificial Intelligence</td><td colspan="2">- AAAI(Association for the Advancement of Artificial Intelligence) ์ฃผ์ต์ ์ 39ํ ์ธ๊ณต์ง๋ฅ ์ฐ๋ก ํ์ ๋ํ - AAAI ํ์ ๋ํ๋ ์ธ๊ณต์ง๋ฅ(AI) ์ฐ๊ตฌ๋ฅผ ์ด์งํ๊ณ AI ๋ฐ ๊ด๋ จ ํ๋ฌธ ์ ๋ฐ์ ์ฐ๊ตฌ์, ์ค๋ฌด์, ๊ณผํ์, ํ์ ๋ฐ ์์ง๋์ด ๊ฐ ๊ณผํ์ ๊ต๋ฅ๋ฅผ ์ด์ง - ํนํ, ์ด๋ฒ ํ์ฌ๋ AI์ ๋ค์ํ ๋ถ์ผ ๊ฐ ํ์ ์ ์ด์งํ๊ณ , ์ฑ ์ ์๋ AI์ ์ฌํ์ ์ํฅ์ ๋ํ ๋ ผ์๋ ํฌํจ๋ ์์ </td></tr><tr><td>๊ธฐ๊ฐ</td><td>์ฅ์</td><td>ํํ์ด์ง</td></tr><tr><td>2025.2.25~3.4</td><td>๋ฏธ๊ตญ, ํ๋ผ๋ธํผ์</td><td>
https://aaai.org/conference/
aaai/aaai-25/</td></tr></table>
๋จผ์ , ํ๋ฅผ HTML ๋ก ์ถ์ถํ ๊ฒฐ๊ณผ์ ๋๋ค. ํด๋น ๋ด์ฉ์ ์๋ ํ๋กฌํํธ๋ฅผ ์ฌ์ฉํ์ฌ ํ์ ์ ๋ณด๋ฅผ ์ ์ฐพ์๋ด์ด ๋ต๋ณํ๋ ์ง ์ดํด๋ดค์ต๋๋ค.
messages=[
{
"role": "system",
"content": "Answer the user's questions based on the given context."
},
{
"role": "assistant",
"content": table_example['html']
},
{ "role": "user",
"content": "CES ๊ฐ ์ด๋ฆฌ๋ ์ฅ์์ ์ฐธ๊ณ ํ ์ ์๋ ์ฌ์ดํธ๋ฅผ ์๋ ค์ฃผ์ธ์."
}
]
stream = client.chat.completions.create(
model="solar-pro",
messages=[
{
"role": "system",
"content": "Answer the user's questions based on the given context."
},
{
"role": "assistant",
"content": table_example['html']
},
{ "role": "user",
"content": "CES ๊ฐ ์ด๋ฆฌ๋ ์ฅ์์ ์ฐธ๊ณ ํ ์ ์๋ ์ฌ์ดํธ๋ฅผ ์๋ ค์ฃผ์ธ์."
}
],
stream=False,
)
๋ชจ๋ธ๋ณ ๋ต๋ณ ๊ฒฐ๊ณผ
Upstage - solar-pro
CES 2025๋ ๋ฏธ๊ตญ LA์์ ๊ฐ์ต๋๋ฉฐ, ์ฐธ๊ณ ํ ์ ์๋ ์ฌ์ดํธ๋ <https://www.ces.tech/>์ ๋๋ค.
Open AI - gpt-4o
CES๋ 2025๋ 1์ 7์ผ๋ถํฐ 10์ผ๊น์ง ๋ฏธ๊ตญ ๋ผ์ค๋ฒ ์ด๊ฑฐ์ค์์ ์ด๋ฆฝ๋๋ค. ์ฐธ๊ณ ํ ์ ์๋ ์ฌ์ดํธ๋ [https://www.ces.tech/](https://www.ces.tech/) ์ ๋๋ค.

์ฒซ ์ง๋ฌธ๋ถํฐ ํฐ ์ฐจ์ด์ ์ ํ์ธํ๊ฒ ๋์์ต๋๋ค. ํด๋น ๋ฌธ์์ ์ค๋ฅ์ธ์ง, CES ํ์ฌ๋ฅผ ์ค๋ช ํ๋ ๋ฉ์ธ ์ ์์๋ ๊ฐ์ต ์ฅ์๊ฐ ๋ผ์ค๋ฒ ์ด๊ฑฐ์ค ๋ผ๊ณ ๋์ด ์๋ ๋ฐ๋ฉด, ์ฅ์ ์ ์์๋ ๋ฏธ๊ตญ, LA ๋ผ๊ณ ์์ฑ๋์ด ์๋๋ฐ์.
ํ์ ํน์ฑ์ ์ ํ์ ํ๊ณ ์๋ Solar-pro ๋ชจ๋ธ์ "์ฅ์" ์ ์ ์์ฑ๋ ๋ฏธ๊ตญ, LA ์ ๋ณด๋ฅผ ๋ฐํํ์ผ๋ฉฐ, gpt-4o๋ ๋ฉ์ธ ์ ์ ์์ฑ๋ ์ ๋ณด๋ฅผ ์ข ๋ ๋ฏฟ์๋ ๋ชจ์์ธ ์ง ๋ผ์ค๋ฒ ์ด๊ฑฐ์ค๋ผ๊ณ ๋ตํ์ต๋๋ค. ๋ฐ๋ก ๊ฒ์ํด ์ฐพ์๋ณด๋ ์ค์ ์ฅ์๋ ๋ผ์ค๋ฒ ์ด๊ฑฐ์ค๊ฐ ๋ง๋๋ผ๊ตฌ์. ์ด์จ๋ ํ๊ฐ ๋งํ๋ ๋๋ก ์ ์ ๋ฌํด์ค Solar ๋ชจ๋ธ์ ์๋ชป์ด ์์ต๋๋ค ๐ถ
Example 2 - JPG, Figure

'<figure id=\'0\'><img style=\'font-size:16px\' alt="Subjects Signed Consent\n(signed consent form)\nN=103\nSubjects Enrolled Protocol violation\nN=100 N=3\n(Table 1)\nSubject with baseline Subjects refused to\nangiogram continue in study\nN=81 N=19\n(Table 2)\nIVUS No IVUS\nN=63 N=18\nAll SVG occluded\nor diseased" data-coord="top-left:(247,217); bottom-right:(2001,1508)" /></figure>'
๋๋ฒ์งธ ์์ ๋ ๊ทธ๋ฆผ์ ๋๋ค. ์ด 103 ๋ช ์ ํผํ์๊ฐ ๋ฑ๋ก๋์๋ ์ง, ์ ์ธ๋์๋ค๋ฉด ๋ช๋ช ์ธ์ง ๋ฑ์ ํฌํจํ๋ ๊ทธ๋ฆผ์ ๋๋ค. 3๋ช ์ ์ ๊ฑฐ์ ๋นํ๋ ์ง ("Why were 3 rejected?")๋ฅผ ์ง๋ฌธํ์ต๋๋ค. ๋๋ฒ์งธ ์ค์ "Protocol violation" ์ด๋ผ๋ ์ด์ ๋ก ์ด 3๋ช ์ด reject ๋์์์ ํํํ๊ณ ์์ต๋๋ค.
๋ชจ๋ธ๋ณ ๋ต๋ณ ๊ฒฐ๊ณผ
Upstage - solar-pro
Three subjects were rejected due to protocol violations, as indicated in Table 1.
Open AI - gpt-4o
The context indicates that 3 subjects were considered "protocol violations" after being enrolled in the study, which led to their rejection. This means that these subjects likely did not meet the study's requirements or follow its procedures, resulting in their exclusion from the study.
๋ ๋ชจ๋ธ ๋ชจ๋ Protocol violations ์ด๋ผ๋ ์ด์ ๋ฅผ ์ ๋๋ก ๋๊ณ ์์ต๋๋ค. ๊ทธ๋ฌ๋ ๋ต๋ณ์ ๊ธธ์ด์ ๋ด์ฉ์ด ์ข ๋ค๋ฅธ๋ฐ์. solar-pro ๋ชจ๋ธ์ ๊ฑฐ์ ์ ์ด์ ์ ํด๋น ๋ถ๋ถ์์ ๊ดํธ ์์ ์์ฑ๋์ด ์๋ (Table 1) ๊น์ง ๋ต๋ณํด์ฃผ๊ณ ์์ต๋๋ค. gpt-4o ๋ Table 1 ์ด๋ผ๋ ๋ฌธ๊ตฌ๋ ๋ฐ๋ก ๋งํด์ฃผ์ง ์์ต๋๋ค. ๊ทธ๋ฌ๋ Protocol violations ์ด ๋ญ์ง ๋ถ๊ฐ์ ์ธ ์ค๋ช ์ ๋ํด์ฃผ๊ณ ์๋ค์. ์ด ๋ด์ฉ์ ํด๋น ์ด๋ฏธ์ง์ ํฌํจ๋ ๋ด์ฉ์ด ์๋๋๋ค.
gpt-4o ๋ต๋ณ์ ํตํด ๋ถ๊ฐ์ ์ธ ์ ๋ณด๋ฅผ ์ป์ ์๋ ์์์ง๋ง, ๋ง์ฝ ์ฃผ์ด์ง context ๋ด์์๋ง ๋ต๋ณ์ ์ํ๋ค๋ฉด solar-pro ๊ฐ ์ ํฉํด ๋ณด์ ๋๋ค.
Example 3 - JPG, Paragraph

โฝ ํผ์ณ์ ์ถ์ถ๋ HTML ํ์ธํ๊ธฐ
<header id='0' style='font-size:14px'>ITC Limited</header> <br><h1 id='1' style='font-size:22px'>Board of Directors</h1> <p id='2' data-category='paragraph' style='font-size:16px'>Yogesh Chander Deveshwar</p> <h1 id='3' style='font-size:18px'>Executive Directors</h1> <br><p id='4' data-category='paragraph' style='font-size:18px'>Anup Singh<br>Krishnamoorthy Vaidyanath</p> <h1 id='5' style='font-size:22px'>Board Committees</h1> <p id='6' data-category='paragraph' style='font-size:18px'>Audit Committee</p> <br><table id='7' style='font-size:14px'><tr><td>S B Mathur</td><td>Chairman</td></tr><tr><td>R K Kaul</td><td>Member</td></tr><tr><td>P B Ramanujam</td><td>Member</td></tr><tr><td>B Vijayaraghavan</td><td>Member</td></tr><tr><td>K Vaidyanath (Director responsible for the Finance Function)</td><td>Invitee</td></tr><tr><td>S Basu (Head of Internal Audit)</td><td>Invitee</td></tr><tr><td>Representative of the Statutory Auditors</td><td>Invitee</td></tr><tr><td>B B Chatterjee</td><td>Secretary</td></tr></table> <br><h1 id='8' style='font-size:20px'>Non-Executive Directors</h1> <br><table id='9' style='font-size:16px'><tr><td>Anil Baijal</td><td>Hugo Geoffrey Powell</td></tr><tr><td>Ravinder Kumar Kaul</td><td>Pillappakkam Bahukutumbi Ramanujam</td></tr><tr><td>Serajul Haq Khan</td><td>Anthony Ruys</td></tr><tr><td>Sunil Behari Mathur</td><td>Basudeb Sen</td></tr><tr><td>Dinesh Kumar Mehrotra</td><td>Balakrishnan Vijayaraghavan</td></tr></table> <h1 id='10' style='font-size:20px'>Compensation Committee</h1> <p id='11' data-category='paragraph' style='font-size:22px'>Corporate Management<br>Committee</p> <br><table id='12' style='font-size:14px'><tr><td>S H Khan</td><td>Chairman</td></tr><tr><td>S B Mathur</td><td>Member</td></tr><tr><td>H G Powell</td><td>Member</td></tr><tr><td>B Sen</td><td>Member</td></tr></table> <table id='14' style='font-size:16px'><tr><td>R K Kaul</td><td>Chairman</td></tr><tr><td>P B Ramanujam</td><td>Member</td></tr><tr><td>A Singh</td><td>Member</td></tr><tr><td>B Sen</td><td>Member</td></tr><tr><td>B Vijayaraghavan</td><td>Member</td></tr><tr><td>B B Chatterjee</td><td>Secretary</td></tr><caption id='13' style='font-size:20px'>Investor Services Committee</caption></table> <p id='15' data-category='paragraph' style='font-size:18px'>Directors</p> <br><table id='16' style='font-size:16px'><tr><td>Y C Deveshwar</td><td>Chairman</td></tr><tr><td>A Singh</td><td>Member</td></tr><tr><td>K Vaidyanath</td><td>Member</td></tr></table> <p id='17' data-category='paragraph' style='font-size:16px'>Executives</p> <br><table id='18' style='font-size:16px'><tr><td>N Anand</td><td>Invitee</td></tr><tr><td>P Chatterjee</td><td>Invitee</td></tr><tr><td>K N Grant</td><td>Invitee</td></tr><tr><td>R G Jacob</td><td>Invitee</td></tr><tr><td>A Nayak</td><td>Invitee</td></tr><tr><td>R Srinivasan</td><td>Invitee</td></tr><tr><td>B B Chatterjee</td><td>Secretary</td></tr></table> <br><h1 id='19' style='font-size:20px'>Nominations Committee</h1> <br><table id='20' style='font-size:14px'><tr><td>Y C Deveshwar</td><td>Chairman</td></tr><tr><td>A Baijal</td><td>Member</td></tr><tr><td>R K Kaul</td><td>Member</td></tr><tr><td>S H Khan</td><td>Member</td></tr><tr><td>S B Mathur</td><td>Member</td></tr><tr><td>D K Mehrotra</td><td>Member</td></tr><tr><td>P B Ramanujam</td><td>Member</td></tr></table> <h1 id='21' style='font-size:20px'>Sustainability Committee</h1> <table id='22' style='font-size:14px'><tr><td>Y C Deveshwar</td><td>Chairman</td></tr><tr><td>H G Powell</td><td>Member</td></tr><tr><td>A Ruys</td><td>Member</td></tr><tr><td>B Sen</td><td>Member</td></tr><tr><td>B Vijayaraghavan</td><td>Member</td></tr></table> <p id='23' data-category='paragraph' style='font-size:18px'>Executive Vice President & Company Secretary<br>Biswa Behari Chatterjee</p> <br><p id='24' data-category='paragraph' style='font-size:16px'>General Counsel<br>Kannadiputhur Sundararaman Suresh</p> <br><h1 id='25' style='font-size:16px'>Investor Service Centre</h1> <br><p id='26' data-category='paragraph' style='font-size:14px'>37 Jawaharlal Nehru Road, Kolkata 700 071, India<br>Phone : 033-2288 6426/2288 0034<br>Fax : 033-2288 2358<br>e-mail : isc@itc.in</p> <p id='27' data-category='paragraph' style='font-size:16px'>Auditors<br>A F Ferguson & Co.<br>Chartered Accountants, Kolkata</p> <br><h1 id='28' style='font-size:18px'>Registered Office</h1> <br><p id='29' data-category='paragraph' style='font-size:14px'>Virginia House<br>37 Jawaharlal Nehru Road, Kolkata 700 071, India<br>Phone : 033-2288 9371<br>ITC corporate website : www.itcportal.com</p> <p id='30' data-category='paragraph' style='font-size:16px'>Report and Accounts 2009 1</p> <footer id='31' style='font-size:20px'>Source: https://www.ind.spoco.mementsuust.educsyndossynb3</footer>
๋ง์ง๋ง ์์ ๋ ์ฌ๋ฌ Paragraph ๋ก ์ด๋ฃจ์ด์ง ์ด๋ฏธ์ง ์ ๋๋ค. ํด๋น ์ด๋ฏธ์ง์์ ํ์ธํ ์ ์๋ ๋ค์ํ ์ ๋ณด ์ค Invector Services Committe ์ ์ํ Chairman(์์ฅ) ์ด ๋๊ตฌ๋ ("Who is the chairman in Investor Services Committee")๊ณ ๋ฌผ์ด๋ดค์ต๋๋ค. ๊ทธ๋ฆผ ์ค๊ฐ ์ฏค์์ R K Kaul ์ด๋ผ๋ ์ด๋ฆ์ ํ์ธํ ์ ์์ต๋๋ค.
๋ชจ๋ธ๋ณ ๋ต๋ณ ๊ฒฐ๊ณผ
Upstage - solar-pro
The chairman in Investor Services Committee is R K Kaul
Open AI - gpt-4o
The chairman of the Investor Services Committee is Ravinder Kumar Kaul (R K Kaul).
์ฌ๊ธฐ์๋ ํ์คํ ๋ชจ๋ธ์ ํน์ง์ ํ์ธํ ์ ์์๋๋ฐ์. gpt-4o ๋ชจ๋ธ์ R K Kaul ์ ํ๋ค์์ ์ด์ผ๊ธฐ ํ๊ณ ์์ต๋๋ค .. ์ด๋ป๊ฒ ์์์๊น์?

์ ์ฒด ๋ฌธ์๋ฅผ ์ดํด๋ณด๋ฉด ์์ ๊ฐ์ต๋๋ค. ๋ฐ๋ก ์๋จ์์ R K Kaul ์ ํ๋ค์์ผ๋ก ์ถ์ธก๋๋ Ravinder Kumar Kaul ์ ํ์ธํ ์ ์์ต๋๋ค. gpt-4o ๋ ๋ ์ด์์์ด ๋๋์ด ์ถ์ถ๋ HTML ์ ์๋ง๋ ํ๋์ ๋ฉ์ด๋ฆฌ๋ก๋ง ์ดํดํ๋ ๋ฏ ํฉ๋๋ค. ์ข๊ฒ ๋งํ๋ฉด ํฐ ์ฒ์ ๋ณด๊ณ ๋ต๋ณ์ ํ๋ค๊ณ ๋ ๋ณผ ์ ์๋๋ฐ, ํน์๋ ๋ ์ฌ๋์ด ๋๋ช ์ด์ธ์ด๋ฉด ์ด๋ป๊ฒ ๋ ๊น์..
solar-pro ๋ชจ๋ธ์ ์ฌ์ฉ์ ์ง๋ฌธ์ ํด๋นํ๋ ์ ๋ณด๋ง ์ฐพ์ ๋ต๋ณํฉ๋๋ค. ๋ค์ ๋งํด, ํน์ ์์ญ์ ์ ํํ๊ฒ ์ฐพ์๋ด์ด, ํด๋น ์์ญ ๋ด์ ์ ๋ณด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ถฉ์คํ ๋๋ตํจ์ ํ์ธํ ์ ์์์ต๋๋ค.
Upstage ์ Document Parse ๋ชจ๋ธ์ ํตํด ๋ฌธ์ ๋ด ๋ ์ด์์ ์์๋ฅผ ๊ณ ๋ คํ HTML ์ ์ถ์ถํ๊ณ , ์ถ์ถํ ๊ฒฐ๊ณผ๋ฅผ LLM ์ ์ ์ฉํด ์ง์์๋ต ํ ์คํธ๋ฅผ ์งํํด๋ณด์์ต๋๋ค. Solar-pro ๋ชจ๋ธ์ ์๋ ค์ง ๊ฐ์ ๋๋ก, ๋ฐ์ดํฐ์ ๊ตฌ์กฐํ๋ ํ์์ ์ ๋๋ก ์ดํดํ ์ ์์ด ํด๋น ์์ญ์ ๋ฒ์ด๋์ง ์๊ณ ์ง๋ฌธ๊ณผ ๊ด๋ จ๋ ๋ถ๋ถ์ ์ ํํ๊ฒ ์ฐพ์๋ด ์ถฉ์คํ ๋๋ต์ ํจ์ ํ์ธํ ์ ์์์ต๋๋ค. Document Parse ์ PDF, ์ด๋ฏธ์ง ๋ฟ ์๋๋ผ ๋ค์ํ ํ์์ ๋ฐ์ดํฐ๋ฅผ ์ง์ํ๋, solar ์ ํจ๊ป ๋ฌธ์์ ํน์ ๋๋ฉ์ธ์ ํนํ๋ LLM์ผ๋ก ๋ฐ์ ์ํค๊ธฐ์ ์ฉ์ดํด๋ณด์ ๋๋ค!
https://huggingface.co/datasets/lmms-lab/DocVQA
lmms-lab/DocVQA ยท Datasets at Hugging Face
powered by Spawning.ai Some elements in this dataset have been identified as opted-out, or opted-in, by their creator.
huggingface.co

โป DocumentQA ๋ฅผ ์ํ ์ด๋ฏธ์ง(JPG)๋ lmms-lab/DocVQA ๋ฐ์ดํฐ์ ์ ์ฌ์ฉํ์ต๋๋ค. ์ฐจํธ, ํ, ๊ทธ๋ฆผ ๋ฑ ๋ค์ํ ํ์์ ๋ฐ์ดํฐ์ ๊ณผ ์์ ์ง๋ฌธ ๋ฐ ์ ๋ต์ ํ์ธํ ์ ์์ต๋๋ค.
'AI' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
๐ Upstage Solar Pro
https://www.upstage.ai/blog/en/solar-pro
Solar Pro: The most intelligent LLM on a single GPUโsupporting more tasks, languages, and domains
Excelling in structured text understanding and domain expertise, Solar Pro tackles complex tasks, multilingual needs, and high-stakes industries.
www.upstage.ai
Upstage(์ ์คํ ์ด์ง) ๋ ์ง๋ 2024๋ 11์ 26์ผ, solar-pro ๋ชจ๋ธ์ ๊ณต์ ์ถ์ํ์ต๋๋ค. ํ๋ผ๋ฏธํฐ ๊ฐ์๊ฐ 22B(220์ต) ๊ฐ ์ด๊ณ Context ๊ธธ์ด๋ 32,768 ์ ๋๋ค. ์์ด, ํ๊ตญ์ด, ์ผ๋ณธ์ด๋ฅผ ์ง์ํ๋ฉฐ 2024๋ 5์๊น์ง์ ๋ฐ์ดํฐ๋ก ํ์ต๋์๋ค๊ณ ํฉ๋๋ค.
solar ๋ ํนํ, HTML ๋ฐ Markdown๊ณผ ๊ฐ์ ๊ตฌ์กฐํ๋ ํ์์ ์ ์ฒ๋ฆฌํ ์ ์๋๋ก ์ค๊ณ๋ LLM ์ ๋๋ค. Upstage ์ Document Parse ๋ชจ๋ธ์ ํตํด ๋ฌธ์๋ฅผ ๊ตฌ์กฐํ ํ์ฌ ์ถ์ถํ๊ณ , ์ด๋ฅผ Solar ์ ์ ์ฉํ ๋ ๊ฐ์ ์ด ์๋ ๋ชจ๋ธ์ธ๋ฐ์. ๊ทธ๋์ OpenAI์ gpt-4o ๋ชจ๋ธ๊ณผ ๋น๊ตํ์ ๋ ์ด๋ค ๋ต๋ณ์ ์ฐจ์ด๊ฐ ์๋ ์ง ์ดํด๋ณด๊ณ ์ ํฉ๋๋ค.
https://console.upstage.ai/docs/capabilities/chat
Upstage Console
Empower your business with Upstage Console.
console.upstage.ai

์ ๋ API๋ฅผ ์ฌ์ฉํ์ฌ Solar-pro ๋ชจ๋ธ์ ํตํ ๋ต๋ณ ์์ฑ ํ ์คํธ๋ฅผ ์งํํ์ต๋๋ค. Upstage์ API Key๋ฅผ ๋ฐ๊ธ๋ฐ๊ณ , ์ ์์ ์ฝ๋๋ฅผ ํตํด ์ฝ๊ฒ ์ฌ์ฉ์ด ๊ฐ๋ฅํฉ๋๋ค.
๐ช Upstage Document Parse
https://console.upstage.ai/docs/capabilities/document-parse
Upstage Console
Empower your business with Upstage Console.
console.upstage.ai
๋ฌธ์ ๊ธฐ๋ฐ์ ๋ต๋ณ ์์ฑ์ ์ํด, Upstage Document Parse ๋ชจ๋ธ๋ก ๋ฌธ์ ๋ด ํ ์คํธ๋ฅผ HTML ํ์์ผ๋ก ์ถ์ถํฉ๋๋ค. Document Parse ๋ PDF, JPEG, PNG, BMP, TIFF, HEIC, DOCX, PPTX, XLSX ํ์์ ๋ฌธ์๋ฅผ HTML๋ก ๋ณํํ๋ AI ๋ชจ๋ธ์ ๋๋ค. ๋จ๋ฝ, ํ, ์ด๋ฏธ์ง ๋ฑ์ ๋ ์ด์์ ์์๋ฅผ ๊ฐ์งํ์ฌ ๋ฌธ์์ ๊ตฌ์กฐ๋ฅผ ํ์ ํ๋ ๊ฒ์ด ํน์ง์ธ๋ฐ์. ๊ฐ๋ น, ๊ฐ์ ํ์ ๋๊ฐ ์ด์์ ๋จ๋ฝ์ด ์๋๋ผ๋, ํ ์คํธ๊ฐ ํจ๊ป ์ถ์ถ๋์ง ์๋๋ก ๋ ์ด์์์ ๊ตฌ๋ถํ ์ถ์ถ์ด ๊ฐ๋ฅํ๋ค๋ ๊ฒ์ ๋๋ค. ์ด๋ฌํ ํน์ง์ ๊ฐ์ง๊ณ ์๊ธฐ์ ํ๊ฐ ๋ง๊ฑฐ๋ ๋จ๋ฝ์ด ์ฌ๋ฌ๊ฐ๋ก ์ชผ๊ฐ์ง ๋ฌธ์์ ์ฌ์ฉํ๊ธฐ์ ์ข์ต๋๋ค.
๋ช๊ฐ์ง ์์ ๋ฅผ ์ ์ฉํด๋ณด๋ฉด์, ์ถ์ถ ๊ฒฐ๊ณผ๋ฅผ ํ์ธํด๋ณด์์ต๋๋ค.
1. table(ํ)


2. list(๋ชฉ๋ก)


3. heading1(์ ๋ชฉ1)


์ด๋ ๊ฒ ๋ฌธ์ ๋ด ํด๋น ์์ญ์ ์์น, ์ข ๋ฅ์ ๋ฐ๋ผ Category๊ฐ ๋ฌ๋ผ์ง๋ฉฐ, HTML ํ์์ผ๋ก ์ถ์ถ๋๋ ๊ฒ์ ํ์ธํ ์ ์์ต๋๋ค. ์ด 12 ๊ฐ์ Category ๊ฐ ์ถ์ถ๋ ์ ์์ผ๋ฉฐ ์๋์ ๊ฐ์ต๋๋ค.

๐ Using Solar Pro for Document QA
๊ทธ๋ผ ์ด์ , Document Parse ๋ฅผ ํตํด ์ถ์ถํ HTML์ LLM์ ๋ฃ์ด ์ง๋ฌธ์ ๋ํ ๋ต๋ณ์ ์งํํด๋ณด๋ ค ํฉ๋๋ค. ์ด๋ฏธ Upstage์ ๋ฐ๋ฅด๋ฉด, solar ๋ชจ๋ธ์ DocumentQA ๋ฐ Table QA ๋ฒค์น๋งํฌ ๋ฐ์ดํฐ๋ฅผ ๋ค์ํ LLM ๋ชจ๋ธ์ ์ ์ฉํ์ฌ ๋น๊ตํ์์ ๋, ๊ฐ์ฅ ์ข์ ์ฑ๋ฅ์ ๋์ ํ์ธํ ์ ์์์ต๋๋ค.

๊ทธ๋ ์ง๋ง ์ค์ ๋ก ์์ฑ๋ ๊ฒฐ๊ณผ๋ฅผ ์ฌ๋์ด ํ์ธํ์ ๋ ์ด๋ค ์ฐจ์ด๊ฐ ๋๊ปด์ง๋ ์ง, ๋๊ฐ์ด ์ ๋ต์ ๋งํ์ ๋๋ ๋ต๋ณ ๋ด์ฉ์ ์ฐจ์ด๊ฐ ์กด์ฌํ ์ง ์ดํด๋ณด๊ณ ์ ํฉ๋๋ค.
Example 1 - PDF, Table

<table id='319' style='font-size:16px'><tr><td>ํ์ฌ๋ช </td><td colspan="3">ํ์ฌ ์ฃผ์ ๊ฐ์</td></tr><tr><td rowspan="3">World Economic Forum</td><td>WORLD ECONOMIC FORUM</td><td colspan="2">- ์ธ๊ณ๊ฒฝ์ ํฌ๋ผ(World Economic Forum, WEF)์ ๋งค๋ ์ค์์ค ๋ค๋ณด์ค(Davos)์์ ์ด๋ฆฌ๋ ์ฐ๋กํ์ฌ๋ก, ์ ์ธ๊ณ ์ฃผ์ ๋ฆฌ๋๋ค์ด ๊ธ๋ก๋ฒ ๊ฒฝ์ , ์ฌํ, ์ ์น, ๊ธฐ์ ์ ๋์ ๊ณผ์ ๋ฅผ ๋ ผ์ - 2025๋ ์ฐ๋กํ์ฌ๋ '์ง๋ฅ์๋์ ํ์ (Collaboration for the Intelligent Age)'์ด๋ผ๋ ์ฃผ์ ๋ฅผ ๋ค๋ฃธ * 5๊ฐ ์ธ๋ถ์ฃผ์ : ์ ๋ขฐ ๊ตฌ์ถ, ์ฑ์ฅ์ ๋ค์ ์์, ์ธ๊ฐ์ ๋ํ ํฌ์, ์ง๊ตฌ๋ฅผ ๋ณดํธ, ์ง๋ฅ์๋์ ์ฐ์ </td></tr><tr><td>๊ธฐ๊ฐ</td><td>์ฅ์</td><td>ํํ์ด์ง</td></tr><tr><td>2025.1.20~24</td><td>์ค์์ค, ๋ค๋ณด์ค</td><td>
https://www.weforum.org/
meetings/world-economic-forum- annual-meeting-2025/</td></tr><tr><td rowspan="3">CES</td><td>CES</td><td colspan="2">- CES(Consumer Electronics Show)๋ ๋งค๋ 1์ ๋ฏธ๊ตญ ๋ผ์ค๋ฒ ์ด๊ฑฐ์ค์์ ๊ฐ์ต๋๋ ์ธ๊ณ ์ต๋์ ๊ฐ์ ๋ฐ IT ์ ์ํ - CES 2025์์๋ AI, ์ง์๊ฐ๋ฅ์ฑ, ์คํํธ์ , ๋์งํธ ํฌ์ค, ์ค๋งํธํ, ๊ตํต, ๋ชจ๋น๋ฆฌํฐ ๋ฑ ์ต์ ๊ธฐ์ ํธ๋ ๋๊ฐ ์๊ฐ๋ ์์ - ํนํ, ์ด๋ฒ ํ์ฌ์์๋ ๋ชจ๋น๋ฆฌํฐ, ์์ ์ปดํจํ ๋ฑ์ ์ ์์ ํ๋ก๊ทธ๋จ์ด ์ ๋ณด์ผ ์์ </td></tr><tr><td>๊ธฐ๊ฐ</td><td>์ฅ์</td><td>ํํ์ด์ง</td></tr><tr><td>2025.1.7~10</td><td>๋ฏธ๊ตญ, LA</td><td>
https://www.ces.tech/
</td></tr><tr><td rowspan="3">AAAI-25</td><td>Association for the Advancement of Artificial Intelligence</td><td colspan="2">- AAAI(Association for the Advancement of Artificial Intelligence) ์ฃผ์ต์ ์ 39ํ ์ธ๊ณต์ง๋ฅ ์ฐ๋ก ํ์ ๋ํ - AAAI ํ์ ๋ํ๋ ์ธ๊ณต์ง๋ฅ(AI) ์ฐ๊ตฌ๋ฅผ ์ด์งํ๊ณ AI ๋ฐ ๊ด๋ จ ํ๋ฌธ ์ ๋ฐ์ ์ฐ๊ตฌ์, ์ค๋ฌด์, ๊ณผํ์, ํ์ ๋ฐ ์์ง๋์ด ๊ฐ ๊ณผํ์ ๊ต๋ฅ๋ฅผ ์ด์ง - ํนํ, ์ด๋ฒ ํ์ฌ๋ AI์ ๋ค์ํ ๋ถ์ผ ๊ฐ ํ์ ์ ์ด์งํ๊ณ , ์ฑ ์ ์๋ AI์ ์ฌํ์ ์ํฅ์ ๋ํ ๋ ผ์๋ ํฌํจ๋ ์์ </td></tr><tr><td>๊ธฐ๊ฐ</td><td>์ฅ์</td><td>ํํ์ด์ง</td></tr><tr><td>2025.2.25~3.4</td><td>๋ฏธ๊ตญ, ํ๋ผ๋ธํผ์</td><td>
https://aaai.org/conference/
aaai/aaai-25/</td></tr></table>
๋จผ์ , ํ๋ฅผ HTML ๋ก ์ถ์ถํ ๊ฒฐ๊ณผ์ ๋๋ค. ํด๋น ๋ด์ฉ์ ์๋ ํ๋กฌํํธ๋ฅผ ์ฌ์ฉํ์ฌ ํ์ ์ ๋ณด๋ฅผ ์ ์ฐพ์๋ด์ด ๋ต๋ณํ๋ ์ง ์ดํด๋ดค์ต๋๋ค.
messages=[
{
"role": "system",
"content": "Answer the user's questions based on the given context."
},
{
"role": "assistant",
"content": table_example['html']
},
{ "role": "user",
"content": "CES ๊ฐ ์ด๋ฆฌ๋ ์ฅ์์ ์ฐธ๊ณ ํ ์ ์๋ ์ฌ์ดํธ๋ฅผ ์๋ ค์ฃผ์ธ์."
}
]
stream = client.chat.completions.create(
model="solar-pro",
messages=[
{
"role": "system",
"content": "Answer the user's questions based on the given context."
},
{
"role": "assistant",
"content": table_example['html']
},
{ "role": "user",
"content": "CES ๊ฐ ์ด๋ฆฌ๋ ์ฅ์์ ์ฐธ๊ณ ํ ์ ์๋ ์ฌ์ดํธ๋ฅผ ์๋ ค์ฃผ์ธ์."
}
],
stream=False,
)
๋ชจ๋ธ๋ณ ๋ต๋ณ ๊ฒฐ๊ณผ
Upstage - solar-pro
CES 2025๋ ๋ฏธ๊ตญ LA์์ ๊ฐ์ต๋๋ฉฐ, ์ฐธ๊ณ ํ ์ ์๋ ์ฌ์ดํธ๋ <https://www.ces.tech/>์ ๋๋ค.
Open AI - gpt-4o
CES๋ 2025๋ 1์ 7์ผ๋ถํฐ 10์ผ๊น์ง ๋ฏธ๊ตญ ๋ผ์ค๋ฒ ์ด๊ฑฐ์ค์์ ์ด๋ฆฝ๋๋ค. ์ฐธ๊ณ ํ ์ ์๋ ์ฌ์ดํธ๋ [https://www.ces.tech/](https://www.ces.tech/) ์ ๋๋ค.

์ฒซ ์ง๋ฌธ๋ถํฐ ํฐ ์ฐจ์ด์ ์ ํ์ธํ๊ฒ ๋์์ต๋๋ค. ํด๋น ๋ฌธ์์ ์ค๋ฅ์ธ์ง, CES ํ์ฌ๋ฅผ ์ค๋ช ํ๋ ๋ฉ์ธ ์ ์์๋ ๊ฐ์ต ์ฅ์๊ฐ ๋ผ์ค๋ฒ ์ด๊ฑฐ์ค ๋ผ๊ณ ๋์ด ์๋ ๋ฐ๋ฉด, ์ฅ์ ์ ์์๋ ๋ฏธ๊ตญ, LA ๋ผ๊ณ ์์ฑ๋์ด ์๋๋ฐ์.
ํ์ ํน์ฑ์ ์ ํ์ ํ๊ณ ์๋ Solar-pro ๋ชจ๋ธ์ "์ฅ์" ์ ์ ์์ฑ๋ ๋ฏธ๊ตญ, LA ์ ๋ณด๋ฅผ ๋ฐํํ์ผ๋ฉฐ, gpt-4o๋ ๋ฉ์ธ ์ ์ ์์ฑ๋ ์ ๋ณด๋ฅผ ์ข ๋ ๋ฏฟ์๋ ๋ชจ์์ธ ์ง ๋ผ์ค๋ฒ ์ด๊ฑฐ์ค๋ผ๊ณ ๋ตํ์ต๋๋ค. ๋ฐ๋ก ๊ฒ์ํด ์ฐพ์๋ณด๋ ์ค์ ์ฅ์๋ ๋ผ์ค๋ฒ ์ด๊ฑฐ์ค๊ฐ ๋ง๋๋ผ๊ตฌ์. ์ด์จ๋ ํ๊ฐ ๋งํ๋ ๋๋ก ์ ์ ๋ฌํด์ค Solar ๋ชจ๋ธ์ ์๋ชป์ด ์์ต๋๋ค ๐ถ
Example 2 - JPG, Figure

'<figure id=\'0\'><img style=\'font-size:16px\' alt="Subjects Signed Consent\n(signed consent form)\nN=103\nSubjects Enrolled Protocol violation\nN=100 N=3\n(Table 1)\nSubject with baseline Subjects refused to\nangiogram continue in study\nN=81 N=19\n(Table 2)\nIVUS No IVUS\nN=63 N=18\nAll SVG occluded\nor diseased" data-coord="top-left:(247,217); bottom-right:(2001,1508)" /></figure>'
๋๋ฒ์งธ ์์ ๋ ๊ทธ๋ฆผ์ ๋๋ค. ์ด 103 ๋ช ์ ํผํ์๊ฐ ๋ฑ๋ก๋์๋ ์ง, ์ ์ธ๋์๋ค๋ฉด ๋ช๋ช ์ธ์ง ๋ฑ์ ํฌํจํ๋ ๊ทธ๋ฆผ์ ๋๋ค. 3๋ช ์ ์ ๊ฑฐ์ ๋นํ๋ ์ง ("Why were 3 rejected?")๋ฅผ ์ง๋ฌธํ์ต๋๋ค. ๋๋ฒ์งธ ์ค์ "Protocol violation" ์ด๋ผ๋ ์ด์ ๋ก ์ด 3๋ช ์ด reject ๋์์์ ํํํ๊ณ ์์ต๋๋ค.
๋ชจ๋ธ๋ณ ๋ต๋ณ ๊ฒฐ๊ณผ
Upstage - solar-pro
Three subjects were rejected due to protocol violations, as indicated in Table 1.
Open AI - gpt-4o
The context indicates that 3 subjects were considered "protocol violations" after being enrolled in the study, which led to their rejection. This means that these subjects likely did not meet the study's requirements or follow its procedures, resulting in their exclusion from the study.
๋ ๋ชจ๋ธ ๋ชจ๋ Protocol violations ์ด๋ผ๋ ์ด์ ๋ฅผ ์ ๋๋ก ๋๊ณ ์์ต๋๋ค. ๊ทธ๋ฌ๋ ๋ต๋ณ์ ๊ธธ์ด์ ๋ด์ฉ์ด ์ข ๋ค๋ฅธ๋ฐ์. solar-pro ๋ชจ๋ธ์ ๊ฑฐ์ ์ ์ด์ ์ ํด๋น ๋ถ๋ถ์์ ๊ดํธ ์์ ์์ฑ๋์ด ์๋ (Table 1) ๊น์ง ๋ต๋ณํด์ฃผ๊ณ ์์ต๋๋ค. gpt-4o ๋ Table 1 ์ด๋ผ๋ ๋ฌธ๊ตฌ๋ ๋ฐ๋ก ๋งํด์ฃผ์ง ์์ต๋๋ค. ๊ทธ๋ฌ๋ Protocol violations ์ด ๋ญ์ง ๋ถ๊ฐ์ ์ธ ์ค๋ช ์ ๋ํด์ฃผ๊ณ ์๋ค์. ์ด ๋ด์ฉ์ ํด๋น ์ด๋ฏธ์ง์ ํฌํจ๋ ๋ด์ฉ์ด ์๋๋๋ค.
gpt-4o ๋ต๋ณ์ ํตํด ๋ถ๊ฐ์ ์ธ ์ ๋ณด๋ฅผ ์ป์ ์๋ ์์์ง๋ง, ๋ง์ฝ ์ฃผ์ด์ง context ๋ด์์๋ง ๋ต๋ณ์ ์ํ๋ค๋ฉด solar-pro ๊ฐ ์ ํฉํด ๋ณด์ ๋๋ค.
Example 3 - JPG, Paragraph

โฝ ํผ์ณ์ ์ถ์ถ๋ HTML ํ์ธํ๊ธฐ
<header id='0' style='font-size:14px'>ITC Limited</header> <br><h1 id='1' style='font-size:22px'>Board of Directors</h1> <p id='2' data-category='paragraph' style='font-size:16px'>Yogesh Chander Deveshwar</p> <h1 id='3' style='font-size:18px'>Executive Directors</h1> <br><p id='4' data-category='paragraph' style='font-size:18px'>Anup Singh<br>Krishnamoorthy Vaidyanath</p> <h1 id='5' style='font-size:22px'>Board Committees</h1> <p id='6' data-category='paragraph' style='font-size:18px'>Audit Committee</p> <br><table id='7' style='font-size:14px'><tr><td>S B Mathur</td><td>Chairman</td></tr><tr><td>R K Kaul</td><td>Member</td></tr><tr><td>P B Ramanujam</td><td>Member</td></tr><tr><td>B Vijayaraghavan</td><td>Member</td></tr><tr><td>K Vaidyanath (Director responsible for the Finance Function)</td><td>Invitee</td></tr><tr><td>S Basu (Head of Internal Audit)</td><td>Invitee</td></tr><tr><td>Representative of the Statutory Auditors</td><td>Invitee</td></tr><tr><td>B B Chatterjee</td><td>Secretary</td></tr></table> <br><h1 id='8' style='font-size:20px'>Non-Executive Directors</h1> <br><table id='9' style='font-size:16px'><tr><td>Anil Baijal</td><td>Hugo Geoffrey Powell</td></tr><tr><td>Ravinder Kumar Kaul</td><td>Pillappakkam Bahukutumbi Ramanujam</td></tr><tr><td>Serajul Haq Khan</td><td>Anthony Ruys</td></tr><tr><td>Sunil Behari Mathur</td><td>Basudeb Sen</td></tr><tr><td>Dinesh Kumar Mehrotra</td><td>Balakrishnan Vijayaraghavan</td></tr></table> <h1 id='10' style='font-size:20px'>Compensation Committee</h1> <p id='11' data-category='paragraph' style='font-size:22px'>Corporate Management<br>Committee</p> <br><table id='12' style='font-size:14px'><tr><td>S H Khan</td><td>Chairman</td></tr><tr><td>S B Mathur</td><td>Member</td></tr><tr><td>H G Powell</td><td>Member</td></tr><tr><td>B Sen</td><td>Member</td></tr></table> <table id='14' style='font-size:16px'><tr><td>R K Kaul</td><td>Chairman</td></tr><tr><td>P B Ramanujam</td><td>Member</td></tr><tr><td>A Singh</td><td>Member</td></tr><tr><td>B Sen</td><td>Member</td></tr><tr><td>B Vijayaraghavan</td><td>Member</td></tr><tr><td>B B Chatterjee</td><td>Secretary</td></tr><caption id='13' style='font-size:20px'>Investor Services Committee</caption></table> <p id='15' data-category='paragraph' style='font-size:18px'>Directors</p> <br><table id='16' style='font-size:16px'><tr><td>Y C Deveshwar</td><td>Chairman</td></tr><tr><td>A Singh</td><td>Member</td></tr><tr><td>K Vaidyanath</td><td>Member</td></tr></table> <p id='17' data-category='paragraph' style='font-size:16px'>Executives</p> <br><table id='18' style='font-size:16px'><tr><td>N Anand</td><td>Invitee</td></tr><tr><td>P Chatterjee</td><td>Invitee</td></tr><tr><td>K N Grant</td><td>Invitee</td></tr><tr><td>R G Jacob</td><td>Invitee</td></tr><tr><td>A Nayak</td><td>Invitee</td></tr><tr><td>R Srinivasan</td><td>Invitee</td></tr><tr><td>B B Chatterjee</td><td>Secretary</td></tr></table> <br><h1 id='19' style='font-size:20px'>Nominations Committee</h1> <br><table id='20' style='font-size:14px'><tr><td>Y C Deveshwar</td><td>Chairman</td></tr><tr><td>A Baijal</td><td>Member</td></tr><tr><td>R K Kaul</td><td>Member</td></tr><tr><td>S H Khan</td><td>Member</td></tr><tr><td>S B Mathur</td><td>Member</td></tr><tr><td>D K Mehrotra</td><td>Member</td></tr><tr><td>P B Ramanujam</td><td>Member</td></tr></table> <h1 id='21' style='font-size:20px'>Sustainability Committee</h1> <table id='22' style='font-size:14px'><tr><td>Y C Deveshwar</td><td>Chairman</td></tr><tr><td>H G Powell</td><td>Member</td></tr><tr><td>A Ruys</td><td>Member</td></tr><tr><td>B Sen</td><td>Member</td></tr><tr><td>B Vijayaraghavan</td><td>Member</td></tr></table> <p id='23' data-category='paragraph' style='font-size:18px'>Executive Vice President & Company Secretary<br>Biswa Behari Chatterjee</p> <br><p id='24' data-category='paragraph' style='font-size:16px'>General Counsel<br>Kannadiputhur Sundararaman Suresh</p> <br><h1 id='25' style='font-size:16px'>Investor Service Centre</h1> <br><p id='26' data-category='paragraph' style='font-size:14px'>37 Jawaharlal Nehru Road, Kolkata 700 071, India<br>Phone : 033-2288 6426/2288 0034<br>Fax : 033-2288 2358<br>e-mail : isc@itc.in</p> <p id='27' data-category='paragraph' style='font-size:16px'>Auditors<br>A F Ferguson & Co.<br>Chartered Accountants, Kolkata</p> <br><h1 id='28' style='font-size:18px'>Registered Office</h1> <br><p id='29' data-category='paragraph' style='font-size:14px'>Virginia House<br>37 Jawaharlal Nehru Road, Kolkata 700 071, India<br>Phone : 033-2288 9371<br>ITC corporate website : www.itcportal.com</p> <p id='30' data-category='paragraph' style='font-size:16px'>Report and Accounts 2009 1</p> <footer id='31' style='font-size:20px'>Source: https://www.ind.spoco.mementsuust.educsyndossynb3</footer>
๋ง์ง๋ง ์์ ๋ ์ฌ๋ฌ Paragraph ๋ก ์ด๋ฃจ์ด์ง ์ด๋ฏธ์ง ์ ๋๋ค. ํด๋น ์ด๋ฏธ์ง์์ ํ์ธํ ์ ์๋ ๋ค์ํ ์ ๋ณด ์ค Invector Services Committe ์ ์ํ Chairman(์์ฅ) ์ด ๋๊ตฌ๋ ("Who is the chairman in Investor Services Committee")๊ณ ๋ฌผ์ด๋ดค์ต๋๋ค. ๊ทธ๋ฆผ ์ค๊ฐ ์ฏค์์ R K Kaul ์ด๋ผ๋ ์ด๋ฆ์ ํ์ธํ ์ ์์ต๋๋ค.
๋ชจ๋ธ๋ณ ๋ต๋ณ ๊ฒฐ๊ณผ
Upstage - solar-pro
The chairman in Investor Services Committee is R K Kaul
Open AI - gpt-4o
The chairman of the Investor Services Committee is Ravinder Kumar Kaul (R K Kaul).
์ฌ๊ธฐ์๋ ํ์คํ ๋ชจ๋ธ์ ํน์ง์ ํ์ธํ ์ ์์๋๋ฐ์. gpt-4o ๋ชจ๋ธ์ R K Kaul ์ ํ๋ค์์ ์ด์ผ๊ธฐ ํ๊ณ ์์ต๋๋ค .. ์ด๋ป๊ฒ ์์์๊น์?

์ ์ฒด ๋ฌธ์๋ฅผ ์ดํด๋ณด๋ฉด ์์ ๊ฐ์ต๋๋ค. ๋ฐ๋ก ์๋จ์์ R K Kaul ์ ํ๋ค์์ผ๋ก ์ถ์ธก๋๋ Ravinder Kumar Kaul ์ ํ์ธํ ์ ์์ต๋๋ค. gpt-4o ๋ ๋ ์ด์์์ด ๋๋์ด ์ถ์ถ๋ HTML ์ ์๋ง๋ ํ๋์ ๋ฉ์ด๋ฆฌ๋ก๋ง ์ดํดํ๋ ๋ฏ ํฉ๋๋ค. ์ข๊ฒ ๋งํ๋ฉด ํฐ ์ฒ์ ๋ณด๊ณ ๋ต๋ณ์ ํ๋ค๊ณ ๋ ๋ณผ ์ ์๋๋ฐ, ํน์๋ ๋ ์ฌ๋์ด ๋๋ช ์ด์ธ์ด๋ฉด ์ด๋ป๊ฒ ๋ ๊น์..
solar-pro ๋ชจ๋ธ์ ์ฌ์ฉ์ ์ง๋ฌธ์ ํด๋นํ๋ ์ ๋ณด๋ง ์ฐพ์ ๋ต๋ณํฉ๋๋ค. ๋ค์ ๋งํด, ํน์ ์์ญ์ ์ ํํ๊ฒ ์ฐพ์๋ด์ด, ํด๋น ์์ญ ๋ด์ ์ ๋ณด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ถฉ์คํ ๋๋ตํจ์ ํ์ธํ ์ ์์์ต๋๋ค.
Upstage ์ Document Parse ๋ชจ๋ธ์ ํตํด ๋ฌธ์ ๋ด ๋ ์ด์์ ์์๋ฅผ ๊ณ ๋ คํ HTML ์ ์ถ์ถํ๊ณ , ์ถ์ถํ ๊ฒฐ๊ณผ๋ฅผ LLM ์ ์ ์ฉํด ์ง์์๋ต ํ ์คํธ๋ฅผ ์งํํด๋ณด์์ต๋๋ค. Solar-pro ๋ชจ๋ธ์ ์๋ ค์ง ๊ฐ์ ๋๋ก, ๋ฐ์ดํฐ์ ๊ตฌ์กฐํ๋ ํ์์ ์ ๋๋ก ์ดํดํ ์ ์์ด ํด๋น ์์ญ์ ๋ฒ์ด๋์ง ์๊ณ ์ง๋ฌธ๊ณผ ๊ด๋ จ๋ ๋ถ๋ถ์ ์ ํํ๊ฒ ์ฐพ์๋ด ์ถฉ์คํ ๋๋ต์ ํจ์ ํ์ธํ ์ ์์์ต๋๋ค. Document Parse ์ PDF, ์ด๋ฏธ์ง ๋ฟ ์๋๋ผ ๋ค์ํ ํ์์ ๋ฐ์ดํฐ๋ฅผ ์ง์ํ๋, solar ์ ํจ๊ป ๋ฌธ์์ ํน์ ๋๋ฉ์ธ์ ํนํ๋ LLM์ผ๋ก ๋ฐ์ ์ํค๊ธฐ์ ์ฉ์ดํด๋ณด์ ๋๋ค!
https://huggingface.co/datasets/lmms-lab/DocVQA
lmms-lab/DocVQA ยท Datasets at Hugging Face
powered by Spawning.ai Some elements in this dataset have been identified as opted-out, or opted-in, by their creator.
huggingface.co

โป DocumentQA ๋ฅผ ์ํ ์ด๋ฏธ์ง(JPG)๋ lmms-lab/DocVQA ๋ฐ์ดํฐ์ ์ ์ฌ์ฉํ์ต๋๋ค. ์ฐจํธ, ํ, ๊ทธ๋ฆผ ๋ฑ ๋ค์ํ ํ์์ ๋ฐ์ดํฐ์ ๊ณผ ์์ ์ง๋ฌธ ๋ฐ ์ ๋ต์ ํ์ธํ ์ ์์ต๋๋ค.