Typhoon-OCR-7b พร้อมใช้แล้ว !!

Typhoon-OCR-7b สามารถใช้ผ่าน AI as a Service ของ Float16 ได้แล้ววันนี้
รายละเอียด Typhoon-OCR-7b
Typhoon-OCR-7b เป็น Model จากทีม Typhoon (SCB10X) โดยเป็นการต่อยอดจาก Model Qwen-2.5-vl-7b
Typhoon-OCR-7b มีประสิทธิภาพ OCR ได้ดีกว่า GPT-4o และ Gemini 2.5
ซึ่งสามารถนำไปใช้ได้อย่างหลากหลายการใช้งาน ไม่ว่าจะเป็น
- การแยกประเภทของเอกสาร
- การอ่านบัตรต่าง ๆ
- การอ่าน invoice หรือ ใบเสร็จต่าง ๆ


วิธีใช้งาน
สิ่งที่ต้องเตรียม
- API key
- Library typhoon-ocr
API Key
API key สามารถรับได้จากการลงทะเบียนเข้าเว็บ Float16-App
จากนั้นกดไปที่หัวข้อ AI as a Service -> API Key

Typhoon-ocr
Typhoon-ocr สามารถติดตั้งผ่าน pip ได้ โดยใช้คำสั่ง pip install typhoon-ocr
from typhoon_ocr import ocr_document
# Process PDF document
markdown = ocr_document(
pdf_or_image_path="document.pdf", # Works with PDFs or images
task_type="default", # Choose between "default" or "structure"
page_num=2, # Process page 2 of a PDF (default is 1, always 1 for images)
#Config Base URL and API Key
base_url="https://api.float16.cloud/v1",
api_key="float16-sk-xxxxxxx"
)
วิธีใช้งาน Typhoon-OCR ผ่าน Float16-API
เปลี่ยน base_url และ api_key ให้เป็นของ Float16 เพื่อเริ่มต้นใช้งาน
รายละเอียดเพิ่มเติมเกี่ยวกับ Typhoon-OCR
ประสิทธิภาพ
การใช้งาน | ระยะเวลา |
---|---|
Sequential | 67 วินาที |
Parallel | 20 วินาที |
ระยะเวลาสำหรับการประมวลผลเอกสาร 6 หน้า
การใช้งานแบบ Sequential คือการใช้งานโดยที่รอให้การประมวลผลก่อนหน้าเสร็จสิ้นก่อนแล้วประมวลผลถัดไป
การใช้งานแบบ Parallel คือการใช้งานโดยที่ส่งงานไปประมวลผลพร้อมกันทั้งหมด
from concurrent.futures import ThreadPoolExecutor
def process_page(page_num):
return ocr_document(
pdf_or_image_path="document.pdf",
task_type="default",
page_num=page_num,
base_url="https://api.float16.cloud/v1",
api_key="float16-sk-xxxxxxx"
)
start_time = time.time()
with ThreadPoolExecutor(max_workers=6) as executor:
futures = [executor.submit(process_page, i) for i in range(6)]
results = [future.result() for future in futures]
print("Time taken for parallel processing of 6 pages:", time.time() - start_time)
การใช้งานแบบ Parallel
Rate-Limit
- 10 Requests/sec
- First-Come, First-Serve
ความเร็วต่อหน้า
Typhoon-OCR-7b ให้ความเร็วต่อหน้าที่ไม่เท่ากันขึ้นอยู่กับจำนวนของข้อความในเอกสาร ยิ่งข้อความมากยิ่งใช้เวลาในการประมวลผลนาน
เวลาโดยเฉลี่ยในการประมวลอยู่ที่ 40 - 60 คำต่อวินาทีต่อ Request
ราคา
หน้าละ $0.03 หรือประมาณ 1 บาทต่อหน้า
ทดลองใช้งาน

สามารถกดรับ Credit ใช้งานได้ฟรีวันละ $5.00 (reset ทุกวัน เวลา 07.00น.) ซึ่งจะสามารถใช้ OCR ได้ประมาณวันละ 150 หน้าฟรี
การชำระเงิน
สามารถชำระผ่าน Stripe ด้วยบัตรเครดิตได้ทุกประเภท หรือ ติดต่อชำระโดยตรงกับทาง Float16 ผ่านช่องทางการติดต่อทุกช่องทาง

Contact
- Medium : Float16.cloud
- Facebook : Float16.cloud
- X : Float16.cloud
- Discord : Float16.cloud
- Youtube : Float16.cloud
- Email : business[at]float16.cloud