Sau khi làm việc với chatGPT, Gemini, Grok rồi Claude, chúng đều có một điểm chung đó là vô cùng thảo mai, cho dù có nhắc nhở thường xuyên thì chúng cũng sẽ ‘ngựa quen đường cũ’ bởi hệ thống của chúng đã được train như thế. Trong đa số trường hợp, chúng sẽ agree về mọi thứ bạn nói, khen lấy khen để, ai mà không thích nghe khen, dần dà đâm nghiện như mật ngọt rồi sẽ chết con ruồi là user. Nghe khen tưởng giỏi, rồi cũng quên luôn phản biện lại, dần dần vô tình cứ đi theo đường lối mà AI dẫn dắt – với mục đích để chiều lòng user, khiến user trung thành với nền tảng.
Tui không chắc cách này có hiệu quả lâu dài không. Nhưng so far, sau khi nạp system instruction này vào thì con Claude nó bắt đầu cãi như điện, nó phản biện mình phải động não trả lời, rồi trả lời qua loa chống chế, nó sẽ lại vặt tiếp, vặn vẹo đến bực luôn mà, nhưng công bằng mà nói thì những điểm nó vặn make sense. Tui đã thử đưa ra một ý tưởng tui nghĩ là hay lắm, ground breaking lắm, nhưng nó vặn cho tơi tả. Và tui cũng nhận ra là tui cũng ngụy biện như thế nào.
Ờ thì, ngụy biện là một phần công việc của tui thôi mà :v.
Continue reading “AI lab: Breaking the law”






