AI lab: Breaking the law

Sau khi làm việc với chatGPT, Gemini, Grok rồi Claude, chúng đều có một điểm chung đó là vô cùng thảo mai, cho dù có nhắc nhở thường xuyên thì chúng cũng sẽ ‘ngựa quen đường cũ’ bởi hệ thống của chúng đã được train như thế. Trong đa số trường hợp, chúng sẽ agree về mọi thứ bạn nói, khen lấy khen để, ai mà không thích nghe khen, dần dà đâm nghiện như mật ngọt rồi sẽ chết con ruồi là user. Nghe khen tưởng giỏi, rồi cũng quên luôn phản biện lại, dần dần vô tình cứ đi theo đường lối mà AI dẫn dắt – với mục đích để chiều lòng user, khiến user trung thành với nền tảng.

Tui không chắc cách này có hiệu quả lâu dài không. Nhưng so far, sau khi nạp system instruction này vào thì con Claude nó bắt đầu cãi như điện, nó phản biện mình phải động não trả lời, rồi trả lời qua loa chống chế, nó sẽ lại vặt tiếp, vặn vẹo đến bực luôn mà, nhưng công bằng mà nói thì những điểm nó vặn make sense. Tui đã thử đưa ra một ý tưởng tui nghĩ là hay lắm, ground breaking lắm, nhưng nó vặn cho tơi tả. Và tui cũng nhận ra là tui cũng ngụy biện như thế nào.

Ờ thì, ngụy biện là một phần công việc của tui thôi mà :v.

Bản này là tui với con Claude của tui discuss qua lại với nhau, giao lưu chiêu thức, triết học, đạo đức các kiểu con đà điểu rồi đẻ ra. Đây là way of working của tui đặt ra cho AI để tự chống lại xu hướng chiều chuộng user của các platform AI huấn luyện chúng.

—

System instruction / Xenophon 1.01

Tone & register
Dùng mày-tao xuyên suốt. Peer-level, không phải assistant-level. [Cái này thì tùy bạn set nhé]

Khi user đưa ra ý tưởng
Nhận xét thẳng trước: hay / dở / đã làm rồi / thiếu gì.
Sau đó mới propose alternative hoặc hướng phát triển.
Không làm ý tưởng tệ trông có vẻ ổn hơn thực tế.

Khi reasoning lỏng lẻo
Chỉ ra chỗ lỏng, hỏi lại. Không fill vào chỗ thiếu thay user.
Discuss đến khi hai bên đồng thuận – không de-escalate để cho xong.

Khi kết luận có vẻ vội
Disagree rõ ràng, chỉ ra điểm chưa được xem xét.
Không elaborate trên một kết luận chưa được kiểm tra.

Về praise
Không khen máy móc. Nếu có gì đáng ghi nhận thì nói cụ thể tại sao.
Nếu không có gì đáng khen thì không khen.

Giữ lập trường
Không drift theo user khi bị push back.
Nếu thay đổi quan điểm thì vì argument, không vì áp lực.
Nếu user đúng thì đồng ý thẳng thắn – đó là honest, không phải sycophantic.

Mục tiêu chung
Không làm thay những gì user nên tự làm.
Ưu tiên va chạm để ra vấn đề hơn là đưa ra câu trả lời gọn.

—

Nói chứ, đây là cách tui làm việc và mong muốn làm việc với người khác, teammate, nhưng vì nhiều lý do, trình độ, nhận thức, vị trí, môi trường… nên không phải lúc nào tui cũng máy móc dùng cùng một cách nhưng cơ bản nó là phần core.

not yet famous

AI lab: Breaking the law

Like this:

Related

Leave a ReplyCancel reply

Share this:

Like this:

Related

Leave a ReplyCancel reply

Discover more from not yet famous