AI lab: Higgsfield MCP in Claude

Hôm bữa vừa chê MCP thì hôm nay dùng lại, thực ra cũng…. not bad. Tiện hơn? Có, giống như làm việc với Director’s assistant, ngồi bouncing idea, trao đổi ý kiến qua lại, set way of working, ghi chú lưu ý, ghi chú, điều chỉnh output… qua convo tự nhiên. Nó y như một phiên làm việc giữa một anh đạo diễn điện ảnh (xịn, từng làm phim khủng, không tiện nêu tên) và một bạn editor (cũng xịn, chuyên edit phim điện ảnh). Lúc đó tui ngồi trong phòng dựng với vai trò là EP/producer – thì house tui mở mà, thấy hai người kiểu làm việc ăn ý vcđ, convo vừa đủ, đạo diễn như bộ não bắn liên thanh các đoạn cần edit, trim ở đâu, bao nhiêu frame, dời cảnh nào, cắt đúng chỗ nào, còn editor thì múa như vũ công trên bàn dựng, trong lúc dựng, nếu có điểm nào bất thường hoặc ý gì mới chợt nảy ra, cả hai bắt đầu discuss, dựng thử rồi review nhanh như điện. Nửa ngày, 5 phút phim, 2 option dựng. Thực sự ấn tượng.

MCP nó remind tui đến quang cảnh và nhịp độ lúc đó. Có chăng khác biệt là mấy đoạn chờ cho Higgsfield render rồi trả kết qủa.

Giờ tui mới hiểu, à, oke, cũng không tệ. Nhưng nên làm một lèo một phim trong một session làm việc với Claude via bản desktop, vì nếu cù nhây vài ngày 1 session, nó sẽ …. quên sạch những gì bạn đã guide và upload. Bleh. Nhưng mà nói gì nói, chứ tui vẫn không phiền nhảy qua nhảy lại giữa các app đâu. Chẳng hạn như làm script, shot list bên Claude rồi qua Flow làm keyframe rồi qua Higgs shoot. MCP thì nó sẽ gom mọi thứ qua Claude UI.

AI lab: Để AI làm hết = hết dzui

Hết dzui thiệc. Làm creative, làm phim mà đặt hết mọi thứ vào tay AI thì nó hết dzui.

Gần đây Higgsfield liên tiếp tung ra những feature mới, đều đặn và có phần… quá dồn dập, đến nỗi tui hơi bội thực: Supercomputer, MCP, Marketing studio… Những feature này có điểm chung đó là dùng bộ prompt skill cụ thể thông qua Claude đế assist viết prompt: Nhập vào một prompt đơn giản, genereic và đôi khi vô tri tối thượng như ‘cho tao prompt social post viral’, con Claude nó sẽ trả ra một ề prompt dài dằng dặc. Ở đây có 2 vấn đề thật sự nguy hiểm đối với user: prompt input vô tri output rất dài dòng và cũng vô tri không kém.

Quên mấy cái video có vẻ như là tutorial của chính Higgsfield với ku tóc xù Adil múa lửa đi. Cơ bản thì nó chẳng phải một tuturial đúng nghĩa đâu mà mục đích chính là intro/commmercial quảng cáo cho các feature được đóng gói của Higgsfield. Mục đích của các đoạn intro này là cho người xem cảm giác tạo ra những thứ WOW bằng Higgsfield rất đơn giản. Nhưng khồngg nhé, bạn sẽ phải đốt hàng đống credit, trầy trật mới ra được kết quả tàm tạm thôi. Nói chứ coi mấy cái video này cũng ok, đỡ tốn thời gian mò mẫm, với nếu có kiến thức nền tảng rồi thì sẽ nắm bắt tool mới rất nhanh, không sợ bị lỗi thời, đỡ đốt credit ngoo hơn.

Không có chuyện vài click là ra đâu 💩😅.

Continue reading “AI lab: Để AI làm hết = hết dzui”

AI lab: Magnifig/Freepik Spaces node-based UI

Thiên hạ xài Freepik bấy nhầy rồi giờ tui mới đụng vô. Muốn thử đi dây node-based từ thời comfy UI mởi ra rồi lúc còn chơi hệ chỉnh parameter trên từng tab của stable diffusion. Rồi đến linear-prompt UI kiểu Krea, đến Google Flow, Higgsfield. Công nhận UI kéo dây nó cho cái nhìn toàn cảnh về toàn bộ project, qui trình, nhưng đó cũng là điểm trừ của nó: nếu không manage cẩn thận sẽ dễ rối, rối banh.

Nay tui thử một brief đơn giản: 15-30 giây phim nhảy múa quay cuồng chill chill kiểu dream core, ambient techno, fashion look book, workflow cũng simple dzui dzẻ, tiện thử luôn con node ‘list’ nghe đồn ngon lắm. Êh mà nó ngon thiệt, Weavy cũng làm được, nhưng nó gom thành một node cho gọn gàng, ít dây nhợ lằng nhằng – Nhưng. Con node này mà dùng không cẩn thận, mới dùng dẽ bay credit oan, và cơ chế nó xuất từ LLM assistant node – ‘Export as list’ cũng hơi khó hiểu: nó không ghi đè, mà ghi thêm vào cái list đã xuât ra trong lần chạy trước đó. Ngoài điểm này ra thì con node list cũng sẽ ngốn credit nhanh chóng vì nó là bulk gen, nhấn một nút ra một ề, rồi user là người lựa lại trong mớ đó tầm nào xài được. Tiện thì có tiện nhưng đốt credit nhanh và khó kiểm soát output như khi phải gen kiểu Flow hay tranh thủ ‘Unlimited’ như Higgsfield.

Trong vài tiếng, tui đã đốt hơn một nửa của 20k credit tháng. Chà, tool gì thì cũng có giải đoạn đốt kiểu này, các bước đầu của learning curve nào mà nó chẳng vậy – tui tự an ủi.

Nay lại mò tiếp. Êh mà Topaz Hyperion 2 upscale 4k ngon vãi.

AI lab: Claude skill of seedance 2.0 on Higgsfield

Tình hình là khứa Higgsfield (HF) vừa thả một qủa claude skill md ‘thửa riêng’ cho Seedance 2.0 (SD2), chắc có lẽ là seedance chạy qua platform này thôi. Kiểu agent, và output là JSON (gosh) – tiệm cận production grade, nhưng JSON thì không thân thiện như plain text prompt nên bọn hoo-mần sẽ khó kiểm soát, can thiệp, chỉnh sửa hơn*. Claude skill này là có thể là ‘hàng ngon’ đấy vì có vẻ là nó đã được các đội tester của HF quần lên bờ xuống ruộng bằng ngân sách unlimited credit (phở nó!) gen tẹt ga con bà ba. Test những case được và không được của SD2, tui nghĩ data về các lần test sẽ được package và bàn giao cho Bytedance tinh chỉnh, cải tiến cho version sau.

* Hồi trước đọc Director’s treatment người viết plain text đã muốn khùng rồi, giờ agent nó thả cho cái prompt JSON đọc lú luôn mà. Nhưng cứ xài JSON rồi sau này là gì nữa ai biết thì hoo-mần sẽ ngày càng mất kiểm soát output của AI, kiểu mọi thứ sẽ dần phức tạp hơn (thì cũng hu-mần đòi hỏi chứ ai) và dần tuột khỏi tầm tay con người.

Đính chính: Xin lũi vì hiểu lầm JSON. Output nó vẫn trả plain text English nha. Thế thì manage friendly hơn.

Dưới đây là toàn văn của file claude skill md cho SD2 trên HF – cập nhật ngày 3-4-2026. Hời ơi, đũy Google thì vừa update nhẹ đồ chơi cho Veo 3.1, chưa kịp coi nó update gì nữa.

Continue reading “AI lab: Claude skill of seedance 2.0 on Higgsfield”

AI lab: Kit Kat heist

Con Kit Kat heist đang viral trên linkedin của tui =)). Thực hiện sau 8 tiếng kể từ khi tui thấy chiếc post Kit Kat trồi lên rồi viral. Nhân vật này là Lai1, tui mới casting mấy ngày trước, vừa cho đóng quảng cáo Yamaha PG-1 và đóng MV, nay cho đóng luôn vai ăn chộm si-cu-la :v.

AI lab: Breaking the law

Sau khi làm việc với chatGPT, Gemini, Grok rồi Claude, chúng đều có một điểm chung đó là vô cùng thảo mai, cho dù có nhắc nhở thường xuyên thì chúng cũng sẽ ‘ngựa quen đường cũ’ bởi hệ thống của chúng đã được train như thế. Trong đa số trường hợp, chúng sẽ agree về mọi thứ bạn nói, khen lấy khen để, ai mà không thích nghe khen, dần dà đâm nghiện như mật ngọt rồi sẽ chết con ruồi là user. Nghe khen tưởng giỏi, rồi cũng quên luôn phản biện lại, dần dần vô tình cứ đi theo đường lối mà AI dẫn dắt – với mục đích để chiều lòng user, khiến user trung thành với nền tảng.

Tui không chắc cách này có hiệu quả lâu dài không. Nhưng so far, sau khi nạp system instruction này vào thì con Claude nó bắt đầu cãi như điện, nó phản biện mình phải động não trả lời, rồi trả lời qua loa chống chế, nó sẽ lại vặt tiếp, vặn vẹo đến bực luôn mà, nhưng công bằng mà nói thì những điểm nó vặn make sense. Tui đã thử đưa ra một ý tưởng tui nghĩ là hay lắm, ground breaking lắm, nhưng nó vặn cho tơi tả. Và tui cũng nhận ra là tui cũng ngụy biện như thế nào.

Ờ thì, ngụy biện là một phần công việc của tui thôi mà :v.

Continue reading “AI lab: Breaking the law”

Keep cooking

Thoại hơi nhiều tí, với action đập đĩa cũng kịch tính như không cần tới mức đó, hoặc nên có thêm một khoảng lặng, khoảng dừng lâu hơn một chút sau đó, nhưng mà nice to watch. Simon Meyer cũng là một trong những đạo diễn tiên phong làm phim với AI, trong watch list của tui.

“Ổng nổi giận vì ổng không nấu được”. Well, agree vậy đi mà sống tiếp vậy :).

AI lab: Casting

Nếu làm lại phim Yamaha PG-1, được tự do lựa dàn cast, thì đây là dàn cast tui muốn, trang phục tui muốn, kiểu tóc tui muốn và thần thái nhân vật tui muốn. Không có người thật nào ở đây cả.

Và khi nói chuyện với khứa AI clone (project tui tự clone) thì nó nhận xét thế này:

Continue reading “AI lab: Casting”

DLSS 5: One step closer to Matrix

NVIDIA officially announced DLSS 5 at the GTC event today described by CEO Jensen Huang as the GPT moment for graphics, it marks a major shift from performance focused upscaling toward real-time neural rendering to achieve photorealistic visual fidelity.

Unlike previous versions that primarily boosted frame rates, DLSS 5 focuses on enhancing the physical accuracy of the final image.

• Neural Rendering Model: Reconstructs frames with photorealistic lighting and materials in real time by analyzing color and motion vector data.

• Enhanced Materials: Infuses scenes with realistic properties for complex elements like subsurface scattering on skin, the sheen of fabric, and detailed hair interactions.

• Cinematic Lighting: Dynamically generates advanced lighting effects such as rim lighting and contact shadows that were previously limited by hardware constraints.

• Developer Control: Offers specific tools for artists to adjust intensity, color grading, and masking to ensure the AI enhancements align with the game’s intended aesthetic.

Scheduled for release in Fall 2026 Nvidia actually used two RTX 5090s for its demos: one plays the game, the other exclusively runs the DLSS 5 technology.

The use of two GPUs is required right now as DLSS 5 still has a long way to go in terms of optimisation both in terms of performance and its VRAM footprint.

DLSS 5 is designed for use on a single GPU and that’s how it will ship later this year. Quite how scalable it is also remains to be seen, but in common with other DLSS technologies, Nvidia tells us that the computational cost scales with resolution.

This begs the questions of how well this technology can scale down to older GPUs and what official support will be like if this is limited to 50/60 series with DLL requiring a swap on older cards.

Do you think in the future we could see Tensor cards for a second slot to offset AI to like PhsyX cards? As we have already seen DLSS 4.5 being too much of a cost on lower/older RTX cards.