
Ngoài những giờ cày cuốc trên Google Flow, Higgsfield, bù khú với đám Gems hay ‘máy nghiền’ NotebookLM hằng ngày. Tui tự ‘đẻ’ ra thêm project làm khi rảnh rỗi, một afterwork project: clone bản thân, tui định danh nó là Xenophon. Không phải kiểu clone giọng nói hay ngoại hình – mấy thứ đó tui ổn mà (dĩ nhiên :v), mà là cách suy nghĩ, tư duy, giọng văn. Nghe ngố nhỉ vì có thể nói rằng lối suy nghĩ, tư duy là tổng hoà của rất nhiều thứ từ kinh nghiệm sống, nhân sinh quan, quan niệm, quan điểm, thiên kiến, niềm tin, tín ngưỡng, hệ thống label phức tạp, quan hệ xã hội…v..v..
Nhưng mà được không ta? Ai biết được. Việc làm cho AI – vốn là hoạt động trên nguyên tắc bắt chước có ‘khả năng tư duy’? Thì đừng mong đợi cao quá, tui chỉ cần nó response ở mức cơ bản thôi là được rồi, và cũng phải phân biệt đâu là tư duy thiệt đâu chỉ là hallucination đơn thuần của AI.
Chẹp, hoặc tui chỉ đang phí thời gian, nhưng thôi kệ m*, làm đi.
Đây là mấy thứ tui đã mần sau khi xem… youtube và coi qua một số bài viết, góp nhặt thông tin đây đó.
Bước 0: Chọn nền tảng AI để gửi gắm con AI clone của mình. OpenAI, Google, X, Deepseek, Claude. Khứa nào giờ cũng mạnh như nhau, nhưng có một yếu tố tui xét đến đó là nếu bong bóng AI bể cái bùm thì thằng nào sẽ còn sống để mà xài, chứ không train cho đã xong rồi thì tan huề vốn, mất thời gian. Tui chọn Gemini của Google, dù con này viết lách hơi chán đời, nhưng nó đỡ ảo ma shibuya như con ChatGPT. Với token – nôm na là ‘trí nhớ’ của Gemini hiện là dai nhất, lên đến 1 chẹo token, tức là có thể nạp nhiều content và context cho nó nhất. Mỗi token bằng bao nhiêu từ thì quên rồi.
Bước đầu tiên phải hốt mớ data mình tự tạo ra cho con AI nó học – nói nôm na zị đi. Lưu ý: là tự tạo, tự viết, tự làm. Và đĩ AI nó chỉ nhai text only, tạm thời nó đang mù, dù nó computer vision của nó thì đỉnh vãi ra (nhìn mấy khứa ăn phạt nguội giao thông đi) nhưng chắc để manage năng lực xử lý và tiết kiệm resource không cho mấy đứa user ất ơ (như tui) mò mẫm.
Trong vụ collect data này, khứa nào hay viết blog, viết caption dài loằng ngoằng, để lại digital footprint ngập ngụa trên mạng bỗng nhiên biến thành…lợi thế, vì data vung vãi như này dễ collect hơn mấy khứa làm xong không lưu trữ, chẳng nhớ bỏ đâu, hay mấy đứa thích viết tay. Viết tay cũng được thôi, nhưng chữ rồng bai phượng múa quá thì app đọc chữ viết tay xịn mấy thì nó cũng điếc à.
Rồi, làm sao copy đống chữ đó thành file text cho AI nó nhai? Xài MD – Markdownload, này hay lắm pa, xài Chrome extension, rồi biến mọi vài viết blog thành file text với một nút nhấn. Tiện vc, rồi còn có thể gom nhiều file .md này thành một file md dài. Chằng hạn như description của tất cả work của tui trên website này cũng chỉ có 75KB (quá đẽ). Thả file .md này vào NotebookLM hoặc Gems thì AI nó mê lắm, nó sẽ ‘nhớ’ hết mọi thứ trong file md này. Đó là bước đầu tiên: Tạo cho con AI knowledge base của ku.
Làm biếng viết nữa quá.
Nào quởn viết tiếp.
Đa Kao, 14.01.2026
