Không có dữ liệu, mô hình lớn chỉ là "kẻ ngốc"
Không có dữ liệu, mô hình lớn chỉ là “kẻ ngốc”
Đây là nơi ghi lại những nội dung công nghệ đáng chia sẻ hàng tuần, xuất bản vào mỗi thứ Sáu.
Tạp chí này là nguồn mở, rất hoan nghênh các bạn đóng góp nội dung. Ngoài ra còn có dịch vụ “Ai đang tuyển dụng”, nơi đăng tải thông tin tuyển dụng lập trình viên. Để hợp tác, vui lòng liên hệ qua email (yifeng.ruan@gmail.com).
Ảnh bìa

Hệ thống hành lang rực rỡ sắc màu tại một khu dân cư ở Nhật Chiếu, Sơn Đông. Ngay lối vào giữa rừng cây còn có một quán cà phê xinh xắn. (via)
Không có dữ liệu, mô hình lớn chỉ là “kẻ ngốc”
Nếu bây giờ làm một cuộc khảo sát với câu hỏi: “Bạn có nghĩ các mô hình ngôn ngữ lớn (LLM) thực sự thông minh không?” Tôi tin rằng đa số sẽ trả lời là có. Ngay cả khi AI vẫn đang ở giai đoạn sơ khai, khả năng thay thế con người trong nhiều công việc trí tuệ của nó vẫn là điều vô cùng kỳ diệu.
Tuy nhiên, chúng ta đừng quên bản chất thực sự: Mô hình lớn không phải là phép thuật, càng không phải là những “thực thể trí tuệ silicon” có ý thức. Chúng là các mô hình ngôn ngữ dựa trên quy luật thống kê, mọi hành vi đều xuất phát từ các phép tính toán học.
Bằng chứng rõ nhất là nếu bạn đưa cho nó một bài toán chưa từng xuất hiện trong dữ liệu huấn luyện – tức là không có quy luật thống kê sẵn có – nó sẽ hoàn toàn bó tay. Đó chính là nội dung của một thí nghiệm thú vị mà tôi muốn chia sẻ hôm nay.

Hai nhà nghiên cứu nước ngoài đã chọn ra năm mô hình lớn phổ biến nhất: GPT-5.2, O4-mini, Gemini 3 Pro, Qwen3-235B và Kimi K2. Họ yêu cầu các mô hình này sử dụng năm ngôn ngữ lập trình cực kỳ hiếm gặp – Brainfuck, Befunge-98, Whitespace, Unlambda và Shakespeare – để giải quyết các bài toán khác nhau.
Đặc điểm chung của các ngôn ngữ này là tài liệu trên mạng cực kỳ khan hiếm, vì vậy chúng gần như không xuất hiện trong tập dữ liệu huấn luyện của AI. Kết quả thế nào bạn đoán được chứ?
Nói một cách ngắn gọn: AI thể hiện vô cùng tệ hại. Tỷ lệ trả lời đúng trung bình của năm mô hình này chỉ đạt vỏn vẹn 3,8%, tức là cứ 100 câu thì chỉ đúng chưa đầy 4 câu. Trong khi đó, với Python, tỷ lệ này thường đạt trên 90%.
Đáng buồn hơn, vài câu trả lời đúng ít ỏi đó đều nằm ở mức độ cực kỳ sơ đẳng. Với các bài toán ở mức trung bình và nâng cao, tỷ lệ chính xác của cả năm “siêu AI” đều bằng không.
Thí nghiệm này chứng minh một điều: Trí thông minh của mô hình lớn trước hết được quyết định bởi dữ liệu huấn luyện. Càng nhiều dữ liệu, nó càng giỏi (như Python); càng ít dữ liệu, nó càng tỏ ra ngây ngô và chẳng làm được việc gì nên hồn.
Vậy một câu hỏi thú vị đặt ra là: Nếu một ngôn ngữ hiếm không có dữ liệu trên mạng, nhưng chúng ta cung cấp cho AI một cuốn “Sổ tay hướng dẫn” chi tiết, liệu nó có thể học cách lập trình bằng ngôn ngữ đó ngay lập tức không?
MAI-Image-2
Tuần này, Microsoft đã ra mắt mô hình tạo ảnh của riêng mình mang tên MAI-Image-2.
Nhiều đánh giá cho rằng chất lượng hình ảnh của nó rất cao, hiện chỉ đứng sau nano-banana-2 của Google. Microsoft cũng đã mở trang web MAI Playground để người dùng trải nghiệm miễn phí.

Tôi đã dùng thử và thấy độ chi tiết của ảnh thực sự ấn tượng, trông rất thật. Ví dụ như bức hình “một chú chó đạp xe dưới biển” dưới đây.

Tuy nhiên, nó có khá nhiều hạn chế: (1) Từ chối tạo các hình ảnh nhạy cảm hoặc gây tranh cãi; (2) Hạn mức miễn phí 15 ảnh mỗi ngày, mỗi lần cách nhau 30 giây; (3) Chỉ hỗ trợ tỷ lệ khung hình 1:1; (4) Không có công cụ chỉnh sửa, chỉ đơn thuần là tạo ảnh từ văn bản.
Nếu bạn cần tạo ảnh chất lượng cao từ mô tả, đây là một lựa chọn đáng để thử.
Tin công nghệ
Red Bull vừa phát hành một tạp chí trò chơi bằng giấy mang tên “GamePop”.

Điểm đặc biệt nhất chính là trang bìa tích hợp trò chơi “Xếp gạch” (Tetris) hoàn toàn có thể chơi được. Đây là cuốn sách đầu tiên trên thế giới làm được điều này.


Bí mật nằm ở một bảng mạch linh hoạt siêu mỏng được nhúng ngay trong bìa giấy.

Nó được trang bị 180 đèn LED RGB, 7 nút bấm cảm ứng điện dung và một con chip ARM 32-bit.

Thậm chí nó còn có pin sạc và cổng Type-C để tiếp năng lượng.

Đáng tiếc là đây là phiên bản giới hạn, chỉ có 150 bộ được đánh số thứ tự trên toàn cầu và không bán công khai.
Các doanh nghiệp thường không thích hỗ trợ qua điện thoại bằng người thật vì tốn kém, thay vào đó họ muốn chuyển sang trả lời tự động. HP đã nghĩ ra một cách: ép người dùng phải chờ đợi.

Khi gọi đến tổng đài HP, bạn sẽ được khuyên lên trang web tự tìm câu trả lời. Nếu kiên quyết muốn gặp nhân viên, bạn phải chờ đúng 15 phút. Nếu cúp máy giữa chừng, bạn sẽ phải bắt đầu lại từ đầu. Hệ thống sẽ liên tục nhắc nhở bạn sau mỗi vài phút rằng bạn có thể gửi email hoặc truy cập web thay vì chờ đợi.
Cách làm này tuy gây khó chịu nhưng có lẽ sẽ sớm trở thành tiêu chuẩn: miễn phí thì dùng AI, muốn gặp người thật thì phải trả thêm tiền hoặc tốn thêm thời gian.
Làm sao để ném đĩa vừa nhanh vừa xa? Một nhà vật lý người Mỹ đã thực hiện thí nghiệm với hàng chục sinh viên để tìm ra tư thế và góc ném tối ưu.

Ông phát hiện ra rằng việc đặt ngón tay cái cách mép ngoài của đĩa khoảng 3cm sẽ cho tốc độ xoay và vận tốc ban đầu tốt nhất.

Tốc độ xoay càng cao thì vận tốc ban đầu càng lớn. Vì vậy, lần tới chơi ném đĩa, hãy chú ý vị trí ngón tay cái của bạn nhé.
Bài viết
- Sự sụp đổ chậm chạp của MkDocs (Tiếng Anh)

MkDocs vốn là công cụ tạo trang tài liệu nổi tiếng, nhưng những mâu thuẫn gay gắt giữa các thành viên cốt cán đang khiến dự án này đứng trước nguy cơ tan rã.
- Dùng AI dự đoán thời gian cà phê nguội (Tiếng Anh)

Tác giả đã yêu cầu các mô hình AI đưa ra công thức tính thời gian cà phê hạ nhiệt, sau đó tiến hành đo đạc thực tế để xem AI nào dự đoán chính xác nhất.

Nếu tương lai chúng ta điều khiển điện thoại hoàn toàn qua trợ lý AI, các ứng dụng có lẽ chẳng cần giao diện hiển thị nữa, chúng chỉ cần cung cấp các cổng dữ liệu cho AI là đủ.
- Nén dữ liệu trên trình duyệt bằng Canvas (Tiếng Anh)

Kỹ thuật độc đáo giúp nén dữ liệu thành một hình ảnh ngay tại phía máy khách bằng cách tận dụng thẻ canvas của HTML5.

Tác giả so sánh Python, JavaScript và Ruby khi viết một AI Agent và đưa ra kết luận rằng Ruby mang lại trải nghiệm phát triển thuận tiện nhất.
- Công nghệ bê tông của người La Mã cổ đại (Tiếng Anh)

Việc phát minh ra bê tông đã giúp người La Mã tạo nên những công trình có không gian nội thất khổng lồ và cực kỳ bền vững, tồn tại đến tận ngày nay.
Công cụ
Phiên bản Rust của proxychains4, cho phép điều hướng lưu lượng của một tiến trình qua chuỗi proxy tùy chọn.

Hệ thống blog chạy trên Cloudflare Workers, tích hợp đầy đủ các dịch vụ D1, R2 và KV.
Công cụ tạo đường hầm ánh xạ dịch vụ nội bộ ra internet chỉ với một dòng lệnh, sử dụng giao thức QUIC để đảm bảo tốc độ.

Trình đọc sách đa nền tảng tích hợp AI, hỗ trợ đọc văn bản bằng giọng nói và đồng bộ dữ liệu.

Công cụ hiển thị công thức toán học LaTeX viết bằng Rust, tương thích hoàn toàn với KaTeX.

Ứng dụng giúp bạn tự động ghi lại lịch sử sử dụng máy tính trong ngày để dễ dàng tổng kết công việc.
Khung làm việc UI từ SnapChat, cho phép viết code theo kiểu React nhưng biên dịch ra ứng dụng gốc (native) cho iOS, Android và Mac.

Công cụ giúp thiết lập kho lưu trữ NPM nội bộ cho doanh nghiệp.
Thư viện Node.js mạnh mẽ để theo dõi các sự kiện trên hệ thống tệp tin.
AI
- Giao diện WeChat cho OpenClaw

WeChat vừa chính thức mở cổng kết nối cho các bot AI, cho phép chúng gửi tin nhắn trực tiếp vào ứng dụng. Cộng đồng đã nhanh chóng phát triển nhiều bộ SDK để tận dụng tính năng này:

Công cụ thông báo khi các tác vụ dòng lệnh AI hoàn thành, hỗ trợ gửi tin nhắn qua Telegram, email hoặc các nền tảng chat doanh nghiệp.

Trình quản lý tài nguyên dành cho Claude (Skills, MCP, Agent) trên Mac với giao diện đồ họa tiện lợi.

Một phiên bản tinh chỉnh của OpenClaw nhằm tăng cường bảo mật và giảm thiểu các rủi ro từ mã nguồn gốc.
Tài nguyên

Một kho tri thức khổng lồ được nén vào ứng dụng Linux để bạn có thể tra cứu Wikipedia, bản đồ hay học tập ngay cả khi không có internet.
- AI Coding Agent cho phân tích dữ liệu (Tiếng Anh)

Tài liệu hướng dẫn chi tiết cách dùng AI để thực hiện các bước phân tích dữ liệu chuyên nghiệp từ chuyên gia Simon Willison.

Cuốn sách hướng dẫn TypeScript súc tích và dễ hiểu, đã có bản dịch tiếng Trung.
Hình ảnh
Apple luôn biết cách tạo bất ngờ. Trong hình nền của MacBook Neo mới, họ đã khéo léo lồng ghép tên sản phẩm vào các họa tiết. Thực tế đây là truyền thống của họ từ lâu.

iMac

MacBook Pro

iPad Air

MacBook Air

iPad Mini

iPad Pro

Một sự thật khó tin: trong phần lớn lịch sử loài người, tỷ lệ trẻ em không sống sót đến tuổi trưởng thành từng lên tới gần 50%. Chỉ từ cuối thế kỷ 19, con số này mới bắt đầu giảm mạnh nhờ y học hiện đại.

Điểm tin
“Chỉ những kẻ nô lệ mới định lượng giá trị bản thân bằng năng suất”. Câu nói này khiến tôi phải suy ngẫm về “văn hóa cày cuốc” trên mạng xã hội hiện nay. Mọi người tự hào về việc dậy lúc 5 giờ sáng hay là người cuối cùng rời văn phòng. Nhưng đó chẳng phải là đang cố biến mình thành một cỗ máy sao? Máy móc tuy hiệu quả nhưng lại cứng nhắc. Con người chúng ta nên quý trọng sự linh hoạt và khả năng thích nghi nhanh chóng, thay vì chỉ chăm chăm vào những công việc lặp đi lặp lại một cách vô hồn.
Phát ngôn
Chúng ta đã tạo ra một nền văn minh phụ thuộc sâu sắc vào khoa học kỹ thuật, nhưng lại để cho đa số mọi người không thấu hiểu chúng. Đây là một sự kết hợp nguy hiểm giữa sự thiếu hiểu biết và quyền lực, sớm muộn gì nó cũng sẽ bùng nổ.
— Carl Sagan.
Paris từng là nỗi ám ảnh về tắc đường. Thị trưởng thành phố đã quyết định cắt giảm mạnh số lượng chỗ đậu xe, và kết quả là người dân đã thực sự ít lái xe hơn.
— CNN.
Một nghiên cứu chỉ ra rằng khi học trực tuyến, những sinh viên có ngoại hình ưa nhìn thường có kết quả bài tập thấp hơn so với khi học trực tiếp tại lớp.
— Economics Letters.
Thay đổi lớn nhất của tôi trong những năm qua là thói quen sống vào ban ngày. Việc thức dậy sớm để đón bình minh giúp tâm hồn tôi cảm thấy bình an và nhịp sống hài hòa hơn với thiên nhiên.
— Herman’s Bear Blog.
AI cực kỳ giỏi trong việc biến những ý tưởng rõ ràng thành mã nguồn chạy được. Cái khó nhất và tốn thời gian nhất vẫn là xác định xem tôi thực sự muốn xây dựng cái gì.
— lustin.fr.
Nhìn lại các năm trước
Cách ngăn chặn AI bò lướt dữ liệu (#343)
Một tuần chiếm 2% của một năm (#293)
Trò chuyện với AI Khổng Tử (#243)
Frontend và Backend, bên nào khó hơn? (#193)
(Hết)