AI lab: Higgsfield MCP in Claude

Hôm bữa vừa chê MCP thì hôm nay dùng lại, thực ra cũng…. not bad. Tiện hơn? Có, giống như làm việc với Director’s assistant, ngồi bouncing idea, trao đổi ý kiến qua lại, set way of working, ghi chú lưu ý, ghi chú, điều chỉnh output… qua convo tự nhiên. Nó y như một phiên làm việc giữa một anh đạo diễn điện ảnh (xịn, từng làm phim khủng, không tiện nêu tên) và một bạn editor (cũng xịn, chuyên edit phim điện ảnh). Lúc đó tui ngồi trong phòng dựng với vai trò là EP/producer – thì house tui mở mà, thấy hai người kiểu làm việc ăn ý vcđ, convo vừa đủ, đạo diễn như bộ não bắn liên thanh các đoạn cần edit, trim ở đâu, bao nhiêu frame, dời cảnh nào, cắt đúng chỗ nào, còn editor thì múa như vũ công trên bàn dựng, trong lúc dựng, nếu có điểm nào bất thường hoặc ý gì mới chợt nảy ra, cả hai bắt đầu discuss, dựng thử rồi review nhanh như điện. Nửa ngày, 5 phút phim, 2 option dựng. Thực sự ấn tượng.

MCP nó remind tui đến quang cảnh và nhịp độ lúc đó. Có chăng khác biệt là mấy đoạn chờ cho Higgsfield render rồi trả kết qủa.

Giờ tui mới hiểu, à, oke, cũng không tệ. Nhưng nên làm một lèo một phim trong một session làm việc với Claude via bản desktop, vì nếu cù nhây vài ngày 1 session, nó sẽ …. quên sạch những gì bạn đã guide và upload. Bleh. Nhưng mà nói gì nói, chứ tui vẫn không phiền nhảy qua nhảy lại giữa các app đâu. Chẳng hạn như làm script, shot list bên Claude rồi qua Flow làm keyframe rồi qua Higgs shoot. MCP thì nó sẽ gom mọi thứ qua Claude UI.

AI lab: Để AI làm hết = hết dzui

Hết dzui thiệc. Làm creative, làm phim mà đặt hết mọi thứ vào tay AI thì nó hết dzui.

Gần đây Higgsfield liên tiếp tung ra những feature mới, đều đặn và có phần… quá dồn dập, đến nỗi tui hơi bội thực: Supercomputer, MCP, Marketing studio… Những feature này có điểm chung đó là dùng bộ prompt skill cụ thể thông qua Claude đế assist viết prompt: Nhập vào một prompt đơn giản, genereic và đôi khi vô tri tối thượng như ‘cho tao prompt social post viral’, con Claude nó sẽ trả ra một ề prompt dài dằng dặc. Ở đây có 2 vấn đề thật sự nguy hiểm đối với user: prompt input vô tri output rất dài dòng và cũng vô tri không kém.

Quên mấy cái video có vẻ như là tutorial của chính Higgsfield với ku tóc xù Adil múa lửa đi. Cơ bản thì nó chẳng phải một tuturial đúng nghĩa đâu mà mục đích chính là intro/commmercial quảng cáo cho các feature được đóng gói của Higgsfield. Mục đích của các đoạn intro này là cho người xem cảm giác tạo ra những thứ WOW bằng Higgsfield rất đơn giản. Nhưng khồngg nhé, bạn sẽ phải đốt hàng đống credit, trầy trật mới ra được kết quả tàm tạm thôi. Nói chứ coi mấy cái video này cũng ok, đỡ tốn thời gian mò mẫm, với nếu có kiến thức nền tảng rồi thì sẽ nắm bắt tool mới rất nhanh, không sợ bị lỗi thời, đỡ đốt credit ngoo hơn.

Không có chuyện vài click là ra đâu 💩😅.

Continue reading “AI lab: Để AI làm hết = hết dzui”

AI lab: Magnifig/Freepik Spaces node-based UI

Thiên hạ xài Freepik bấy nhầy rồi giờ tui mới đụng vô. Muốn thử đi dây node-based từ thời comfy UI mởi ra rồi lúc còn chơi hệ chỉnh parameter trên từng tab của stable diffusion. Rồi đến linear-prompt UI kiểu Krea, đến Google Flow, Higgsfield. Công nhận UI kéo dây nó cho cái nhìn toàn cảnh về toàn bộ project, qui trình, nhưng đó cũng là điểm trừ của nó: nếu không manage cẩn thận sẽ dễ rối, rối banh.

Nay tui thử một brief đơn giản: 15-30 giây phim nhảy múa quay cuồng chill chill kiểu dream core, ambient techno, fashion look book, workflow cũng simple dzui dzẻ, tiện thử luôn con node ‘list’ nghe đồn ngon lắm. Êh mà nó ngon thiệt, Weavy cũng làm được, nhưng nó gom thành một node cho gọn gàng, ít dây nhợ lằng nhằng – Nhưng. Con node này mà dùng không cẩn thận, mới dùng dẽ bay credit oan, và cơ chế nó xuất từ LLM assistant node – ‘Export as list’ cũng hơi khó hiểu: nó không ghi đè, mà ghi thêm vào cái list đã xuât ra trong lần chạy trước đó. Ngoài điểm này ra thì con node list cũng sẽ ngốn credit nhanh chóng vì nó là bulk gen, nhấn một nút ra một ề, rồi user là người lựa lại trong mớ đó tầm nào xài được. Tiện thì có tiện nhưng đốt credit nhanh và khó kiểm soát output như khi phải gen kiểu Flow hay tranh thủ ‘Unlimited’ như Higgsfield.

Trong vài tiếng, tui đã đốt hơn một nửa của 20k credit tháng. Chà, tool gì thì cũng có giải đoạn đốt kiểu này, các bước đầu của learning curve nào mà nó chẳng vậy – tui tự an ủi.

Nay lại mò tiếp. Êh mà Topaz Hyperion 2 upscale 4k ngon vãi.

Ai trong agency có lợi thế nhất khi làm việc với AI?

Không phải người giỏi công nghệ. Không phải người hướng nội. Không phải người biết viết prompt hay.

Làm agency lâu dạy tôi một thứ mà tôi không ngờ lại hữu ích khi làm việc với AI: cách đọc giữa những dòng chữ của người không biết mình muốn gì.

Có một hiểu lầm khá phổ biến rằng người “giao tiếp giỏi” sẽ có lợi thế với AI. Nghe thì hợp lý, nhưng không đúng. Giao tiếp giỏi theo nghĩa thông thường: nói chuyện lưu loát, dễ tạo thiện cảm, đọc vị bầu không khí trong phòng… không giúp ích gì ở đây. AI không bị ấn tượng bởi sự tự tin hay cách dẫn dắt câu chuyện. Một câu hỏi mơ hồ sẽ nhận lại câu trả lời mơ hồ, dù có thể bạn hỏi rất duyên.

Continue reading “Ai trong agency có lợi thế nhất khi làm việc với AI?”

AI lab: Claude skill of seedance 2.0 on Higgsfield

Tình hình là khứa Higgsfield (HF) vừa thả một qủa claude skill md ‘thửa riêng’ cho Seedance 2.0 (SD2), chắc có lẽ là seedance chạy qua platform này thôi. Kiểu agent, và output là JSON (gosh) – tiệm cận production grade, nhưng JSON thì không thân thiện như plain text prompt nên bọn hoo-mần sẽ khó kiểm soát, can thiệp, chỉnh sửa hơn*. Claude skill này là có thể là ‘hàng ngon’ đấy vì có vẻ là nó đã được các đội tester của HF quần lên bờ xuống ruộng bằng ngân sách unlimited credit (phở nó!) gen tẹt ga con bà ba. Test những case được và không được của SD2, tui nghĩ data về các lần test sẽ được package và bàn giao cho Bytedance tinh chỉnh, cải tiến cho version sau.

* Hồi trước đọc Director’s treatment người viết plain text đã muốn khùng rồi, giờ agent nó thả cho cái prompt JSON đọc lú luôn mà. Nhưng cứ xài JSON rồi sau này là gì nữa ai biết thì hoo-mần sẽ ngày càng mất kiểm soát output của AI, kiểu mọi thứ sẽ dần phức tạp hơn (thì cũng hu-mần đòi hỏi chứ ai) và dần tuột khỏi tầm tay con người.

Đính chính: Xin lũi vì hiểu lầm JSON. Output nó vẫn trả plain text English nha. Thế thì manage friendly hơn.

Dưới đây là toàn văn của file claude skill md cho SD2 trên HF – cập nhật ngày 3-4-2026. Hời ơi, đũy Google thì vừa update nhẹ đồ chơi cho Veo 3.1, chưa kịp coi nó update gì nữa.

Continue reading “AI lab: Claude skill of seedance 2.0 on Higgsfield”

物极必反 – 物穷则变

Thường tui ít khi coi những content như này, mà thường là tin thế giới, từ đợt Israel với Iran bem nhau từ năm ngoái (cuộc chiến 12 ngày), tui hay xem những nội dung về chiến sự, vũ khí, AI – yep, các loại tool, testing, cập nhật, chưa nói đến các thể loại click bait, rage bait. Spiderum cũng có những bài hay. Khi đi bộ đến metro lại nghe Fonos. Thành thói quen, riết tui thấy tui hơi mợt khi tiếp nhận qúa nhiều thứ từ mắt và tai. Thế rồi những content kiểu này khiến tui thấy dễ chịu hơn. Chậm, tĩnh, vô tri, đơn giản nhưng cũng có nhiều thứ mới mẻ. Còn content nấu ăn, street food nữa, cũng thú vị. Tui prefer mấy kênh phụ đề, ít nói, quay đẹp, chill, nhẹ nhàng – chà mấy chiếc dây thần kinh nó cứ như được massage hoặc kiểu như mấy cái dây nó đang được chìm vào những miếng mash mallow mềm êm ái :3.

Có lẽ khi cognitive overloaded, người ta tự tìm đến những content như này. Vật cùng tắc biến, vật cực tất phản – (物极必反 – 物穷则变) là quy luật, áp dụng cho vạn vật. Chắc là lâu lắm rồi tui chưa gặp lại cảm giác này. Mà có chưa nhỉ? Phải những lần mò mẫm mấy thứ mới như Blender, làm game mobile xuất bản không nhỉ, hay như mấy lần chơi game mới thâu đêm tới sáng :v? Chắc cũng thế.

Ngủ nhiều hơn, ngủ sớm hơn hoặc đọc sách giấy cũng help nhé.

DLSS 5: One step closer to Matrix

NVIDIA officially announced DLSS 5 at the GTC event today described by CEO Jensen Huang as the GPT moment for graphics, it marks a major shift from performance focused upscaling toward real-time neural rendering to achieve photorealistic visual fidelity.

Unlike previous versions that primarily boosted frame rates, DLSS 5 focuses on enhancing the physical accuracy of the final image.

• Neural Rendering Model: Reconstructs frames with photorealistic lighting and materials in real time by analyzing color and motion vector data.

• Enhanced Materials: Infuses scenes with realistic properties for complex elements like subsurface scattering on skin, the sheen of fabric, and detailed hair interactions.

• Cinematic Lighting: Dynamically generates advanced lighting effects such as rim lighting and contact shadows that were previously limited by hardware constraints.

• Developer Control: Offers specific tools for artists to adjust intensity, color grading, and masking to ensure the AI enhancements align with the game’s intended aesthetic.

Scheduled for release in Fall 2026 Nvidia actually used two RTX 5090s for its demos: one plays the game, the other exclusively runs the DLSS 5 technology.

The use of two GPUs is required right now as DLSS 5 still has a long way to go in terms of optimisation both in terms of performance and its VRAM footprint.

DLSS 5 is designed for use on a single GPU and that’s how it will ship later this year. Quite how scalable it is also remains to be seen, but in common with other DLSS technologies, Nvidia tells us that the computational cost scales with resolution.

This begs the questions of how well this technology can scale down to older GPUs and what official support will be like if this is limited to 50/60 series with DLL requiring a swap on older cards.

Do you think in the future we could see Tensor cards for a second slot to offset AI to like PhsyX cards? As we have already seen DLSS 4.5 being too much of a cost on lower/older RTX cards.