AI lab: Chạy Deepseek R1 trên Ollama

Gần đây, anh chị em nào có quan tâm đến AI chắc đã nghe đến Deepseek R1 của các pháp sư trung hoa vừa xuất hiện đã làm choáng váng OpenAI và các anh lớn Google, Microsoft, Meta cũng xây xẩm mặt mày, đến Nvidia – nhà buôn vũ khí cho các anh lớn cũng ‘cứng họng’, chỉ số cổ phiếu ngay lập tức đỏ lòm. Vì sao Deepseek R1 lại gây chú ý như vậy. Ngạn ngữ Việt Nam có câu ‘Cái khó ló cái khôn’ thì trong trường hợp Deepseek R1 hoàn toàn hợp lý. Dù bị chặn đủ đường như cờ vây, nhưng pháp sư trung hoa vẫn tìm được đường thoát và tung cú ‘thôi sơn’ ngoạn mục vào ngay những ngày cuối năm con rồng. Quả là ngoạn mục.

Nói chung deepseek R1 (chính xác là deepseek R1:671b) được đánh giá tốt hơn chatGPT bởi khả năng ‘lý luận’ được cho là thấu đáo hơn, nhưng với giá thành đầu tư rẻ hơn, hiệu quả hơn, tuy chỉ dùng những chip H800 yếu hơn dòng chip H100 chủ lực, một số báo còn gọi H100 là ‘siêu chip’. Và tuyệt vời hơn nữa, mô hình AI của deepseek hoàn toàn là mã nguồn mở, miễn phí cho mọi người. Chà, làm gợi nhớ đến những bộ đôi huyền thoại như Linux và Windows, iOS và Android nhỉ, thật hoài niệm.

Để hiểu thêm về vấn đề này, bạn có thể theo dõi tình hình chip chiến giữa Mỹ và Trung Quốc. Hiểu là ‘cấm vận’ cũng được, tức anh Mỹ cấm anh Nvidia bán chip xịn (H100) cho Trung Quốc vốn được coi là ‘xương sống’ của các đại gia tech Mỹ dùng để train các mô hình AI của họ.

Tiền ít mà vẫn có đồ thơm là có thật. 5-6M$ để train mô hình deepseek-R1 chạy ngang ngửa với chatGPT 4o trong khi đó phải cần 41-78M$ để train mô hình chatGPT 4.

Chờ gì nữa mà không lựm Ollama về thử nghiệm quà Tết miễn phí của anh hàng xóm hả anh em :3, nay mới 28 mà đã có lì xì.

Cập nhật: Thử 1.5b parameter thôi nha bà con nếu không muốn treo máy. Apple M1 chạy toát hết mồ hôi hột đây…

not yet famous

AI lab: Chạy Deepseek R1 trên Ollama

Like this:

Related

Leave a ReplyCancel reply

Share this:

Like this:

Related

Leave a ReplyCancel reply

Discover more from not yet famous