Float16.Cloud Update [02/2024]

Float16.Cloud Update [02/2024]

Float16.Cloud has released a Generative AI service for Southeast Asian languages that is better than ChatGPT (GPT-3.5).

Float16.Cloud supports three new models: one for SEA languages and two for the Thai language. The pricing is 95% cheaper than ChatGPT (GPT-3.5). The models are named:

  1. SeaLLM-7b-v2 (Alibaba)
  2. Typhoon-7b (SCB10X)
  3. OpenThaiGPT-13b (OpenThaiGPT).

The highlight is SeaLLM-7b-v2, developed by DAMO (Alibaba), which supports a total of 10 languages in SEA, including English and Chinese. 

SeaLLM-7b-v2 had an evaluation score that was slightly behind ChatGPT by around 1-2% on the M3Exam (M3e) datasets, which included English, Chinese, Vietnamese, Indonesian, and Thai. 

However, SeaLLM-7b-v2 performed at the same level as ChatGPT on the Sea-bench datasets, which included English, Chinese, Vietnamese, Indonesian, Thai, Burmese, Khmer, Lao, Tagalog, and Malay, and outperformed ChatGPT in the Burmese, Khmer, and Lao languages. [1]

Inference speed performance is another significant improvement. For example, SeaLLM-7b-v2 has a base speed of 100 tokens per second, and the inference demo video can be viewed via this YouTube link.

The use case of Generative AI for SeaLLM-7b-v2 could help us localize into the Southeast Asian region in efficient ways, including helping us draft emails in Vietnamese, generate post captions in Indonesian, find keywords in blog posts in Tagalog, provide text summarization, chatbot services, sentiment analysis, and translation.

You can try SeaLLM-7b-v2 for 'FREE' via https://float16.cloud.

Service

Float16.cloud offers Generative AI services in several options, such as API, API with custom SLA, enterprise subscription for on-premise and on-cloud, and hosting fine-tuned AI models (Bring Your Own Model).

About Float16.cloud 

Float16.cloud is a new product from VulturePrime, and VulturePrime is a startup in the Nvidia Inception Program.

[1] https://huggingface.co/SeaLLMs/SeaLLM-7B-v2

Facebook: VulturePrime

Twitter: @VutlurePrime

Website : https://www.vultureprime.com

Email: business@vultureprime.com

Read more

ทำ Data Extraction จาก image โดยใช้ LLM Multimodal

ทำ Data Extraction จาก image โดยใช้ LLM Multimodal

ในการทำ Data Extraction จากรูปภาพ เช่น สลิปใบเสร็จ, บัตรประชาชน, หรือแบบฟอร์มกระดาษ วิธีดั้งเดิมมักใช้ OCR (Optical Character Recognition) ร่วมกับการเขียน rule หรือ regex เพื่อแยกข้อมูลออกมา ซึ่งยุ่งยากหรือเมื่อรูปแบบข้อมูลเปลี่ยน ซึ่งจริงๆแล้วเรามี

By Thanawat Kittichaikarn
Self-Hosted LLMs for Enterprise #4

Self-Hosted LLMs for Enterprise #4

ตอนสุดท้ายแล้วนะครับ สำหรับการ deploy llm model ใช้งานเอง หลังจากที่แล้ว Setup ตัว service และ tools ต่างๆที่ต้องการครบถ้วนแล้ว เรามาลุยกันต่อเลยครับในการ download model และทำ API Endpoint สำหรับใครที่เพิ่งเข้ามาอ่านตอนนี้เป็นตอนแรก สามารถติดตามตอนก่อนหน้าได้

By Weerasak Suwannapong
Self-Hosted LLMs for Enterprise #3

Self-Hosted LLMs for Enterprise #3

สำหรับใครที่เพิ่งเข้ามาเจอตอนนี้สามารถย้อนกลับไปอ่าน 2 ตอนก่อนหน้าได้ที่ https://blog.float16.cloud/self-hosted-llms-for-enterprise-1/ https://blog.float16.cloud/self-hosted-llms-for-enterprise-2/ 2 ตอนที่ผ่านมา เราได้ติดตั้ง GPU Driver และเชื่อม GPU เข้ากับ Docker ได้เรียบร้อยแล้ว บทนี้เราจะมาติดตั้งเครื

By Weerasak Suwannapong
Self-Hosted LLMs for Enterprise #2

Self-Hosted LLMs for Enterprise #2

ในตอนที่แล้ว เราได้ติดตั้ง NVIDIA GPU Driver ให้พร้อมใช้งานบนเครื่อง EC2 (g5g.xlarge) ที่ใช้ Ubuntu 24.04 LTS บทนี้เราจะทำให้ GPU ที่ติดตั้งไว้สามารถใช้งานได้ภายใน Docker container เพื่อเตรียมต่อยอดไปยังการสร้าง LLM API ด้วย llama.cpp อ่านตอนแรกได้

By Weerasak Suwannapong