Typhoon-OCR-7b พร้อมใช้แล้ว !!

Typhoon-OCR-7b พร้อมใช้แล้ว !!

Typhoon-OCR-7b สามารถใช้ผ่าน AI as a Service ของ Float16 ได้แล้ววันนี้

รายละเอียด Typhoon-OCR-7b

Typhoon-OCR-7b เป็น Model จากทีม Typhoon (SCB10X) โดยเป็นการต่อยอดจาก Model Qwen-2.5-vl-7b

Typhoon-OCR-7b มีประสิทธิภาพ OCR ได้ดีกว่า GPT-4o และ Gemini 2.5

ซึ่งสามารถนำไปใช้ได้อย่างหลากหลายการใช้งาน ไม่ว่าจะเป็น

  • การแยกประเภทของเอกสาร
  • การอ่านบัตรต่าง ๆ
  • การอ่าน invoice หรือ ใบเสร็จต่าง ๆ

วิธีใช้งาน

สิ่งที่ต้องเตรียม

  1. API key
  2. Library typhoon-ocr

API Key

API key สามารถรับได้จากการลงทะเบียนเข้าเว็บ Float16-App

จากนั้นกดไปที่หัวข้อ AI as a Service -> API Key

Typhoon-ocr

Typhoon-ocr สามารถติดตั้งผ่าน pip ได้ โดยใช้คำสั่ง pip install typhoon-ocr

from typhoon_ocr import ocr_document

# Process PDF document
markdown = ocr_document(
    pdf_or_image_path="document.pdf",  # Works with PDFs or images
    task_type="default",               # Choose between "default" or "structure"
    page_num=2,                        # Process page 2 of a PDF (default is 1, always 1 for images)
    #Config Base URL and API Key
    base_url="https://api.float16.cloud/v1",
    api_key="float16-sk-xxxxxxx"
)

วิธีใช้งาน Typhoon-OCR ผ่าน Float16-API

เปลี่ยน base_url และ api_key ให้เป็นของ Float16 เพื่อเริ่มต้นใช้งาน

รายละเอียดเพิ่มเติมเกี่ยวกับ Typhoon-OCR

OCR Model
Documentation for OpenTyphoon.ai’s OCR model, including document parsing capabilities.
GitHub - scb-10x/typhoon-ocr
Contribute to scb-10x/typhoon-ocr development by creating an account on GitHub.

ประสิทธิภาพ

การใช้งาน ระยะเวลา
Sequential 67 วินาที
Parallel 20 วินาที

ระยะเวลาสำหรับการประมวลผลเอกสาร 6 หน้า

การใช้งานแบบ Sequential คือการใช้งานโดยที่รอให้การประมวลผลก่อนหน้าเสร็จสิ้นก่อนแล้วประมวลผลถัดไป

การใช้งานแบบ Parallel คือการใช้งานโดยที่ส่งงานไปประมวลผลพร้อมกันทั้งหมด

from concurrent.futures import ThreadPoolExecutor
def process_page(page_num):
    return ocr_document(
        pdf_or_image_path="document.pdf",
        task_type="default",
        page_num=page_num,
        base_url="https://api.float16.cloud/v1",
        api_key="float16-sk-xxxxxxx"
    )
start_time = time.time()
with ThreadPoolExecutor(max_workers=6) as executor:
    futures = [executor.submit(process_page, i) for i in range(6)]
    results = [future.result() for future in futures]
print("Time taken for parallel processing of 6 pages:", time.time() - start_time)

การใช้งานแบบ Parallel

Rate-Limit

  • 10 Requests/sec
  • First-Come, First-Serve

ความเร็วต่อหน้า

Typhoon-OCR-7b ให้ความเร็วต่อหน้าที่ไม่เท่ากันขึ้นอยู่กับจำนวนของข้อความในเอกสาร ยิ่งข้อความมากยิ่งใช้เวลาในการประมวลผลนาน

เวลาโดยเฉลี่ยในการประมวลอยู่ที่ 40 - 60 คำต่อวินาทีต่อ Request


ราคา

หน้าละ $0.03 หรือประมาณ 1 บาทต่อหน้า


ทดลองใช้งาน

สามารถกดรับ Credit ใช้งานได้ฟรีวันละ $5.00 (reset ทุกวัน เวลา 07.00น.) ซึ่งจะสามารถใช้ OCR ได้ประมาณวันละ 150 หน้าฟรี


การชำระเงิน

สามารถชำระผ่าน Stripe ด้วยบัตรเครดิตได้ทุกประเภท หรือ ติดต่อชำระโดยตรงกับทาง Float16 ผ่านช่องทางการติดต่อทุกช่องทาง

Contact

Read more

AI Bootcamp: LLM Finetuning & Deployment

AI Bootcamp: LLM Finetuning & Deployment

เมื่อวันศุกร์ที่ 4 กรกฎาคม 2025 ที่ผ่านมา Float16 ร่วมกับทีม Typhoon SCB 10X จัดงาน AI Bootcamp: LLM Finetuning & Deployment ขึ้นที่ DistrictX ตึก FYI ซึ่งถือเป็นก้าวสำคัญในการส่งเสริมการพัฒนาเทคโนโลยี AI ในประเทศไทย งานนี้ได้รับความสนใจอย่างล้นหลาม

By Namfon Khaminlao