Issue • #398 • Đọc 15 phút

Chi phí Token đang trở nên không tưởng

Tuần trước, Peter Steinberger, nhà sáng lập OpenClaw, đã chia sẻ lượng Token mình sử dụng.

Chi phí Token đang trở nên không tưởng

Ảnh bìa

Trung tâm Văn hóa Nghệ thuật An Cát tại huyện An Cát, tỉnh Chiết Giang, vừa khánh thành năm ngoái. Nơi đây nổi tiếng với tre, nên mái nhà được thiết kế theo hình dáng lá tre. (daemin_kg@ig)

Chi phí Token đang trở nên không tưởng

Tuần trước, Peter Steinberger, nhà sáng lập OpenClaw, đã chia sẻ lượng Token mình sử dụng.

Anh ấy không có ý khoe khoang mình dùng nhiều bao nhiêu, mà là để giới thiệu CodexBar, một công cụ nhỏ trên menu bar giúp thống kê lượng Token tiêu thụ và tính toán chi phí tương ứng.

Hãy thử đoán xem anh ấy đã dùng bao nhiêu Token?

Theo ảnh chụp màn hình, trong một tháng anh ấy đã gửi 7,6 triệu request, tiêu tốn 603 tỷ Token. Với mức giá định sẵn, số Token này trị giá tới 1,3 triệu USD!

Nói cách khác, việc lập trình với AI của anh ấy tốn trung bình hơn 40.000 USD mỗi ngày.

Tất nhiên, đây không phải số tiền thực chi. Vì là nhân viên của OpenAI, anh ấy có thể sử dụng Token của công ty miễn phí không giới hạn. Nhưng lượng Token anh ấy dùng là thật. Hầu hết các công ty khác đều phải mua Token bên ngoài. Hãy thử tính xem, nếu một lập trình viên dùng hàng trăm tỷ, thậm chí hàng nghìn tỷ Token mỗi tháng, công ty sẽ phải chi trả bao nhiêu?

Một người tốn 1,3 triệu USD mỗi tháng, tương đương gần 9 triệu Nhân dân tệ, một năm sẽ vượt quá 100 triệu Nhân dân tệ (khoảng 350 tỷ VNĐ)! Đó là cái giá phải trả nếu cho phép sử dụng các mô hình hàng đầu một cách thoải mái.

Nếu chuyển sang các mô hình rẻ hơn, chẳng hạn như các mô hình mã nguồn mở rẻ nhất tại Trung Quốc (giá chỉ bằng 1/30 đến 1/50 so với các model flagship nước ngoài), con số vẫn rơi vào khoảng 2 đến 3 triệu Nhân dân tệ mỗi năm.

Kết luận là: Nếu cho phép sử dụng không giới hạn, một lập trình viên có thể tiêu tốn ít nhất 2 đến 3 triệu Nhân dân tệ tiền Token mỗi năm. Còn nếu dùng hàng flagship của Mỹ, chi phí sẽ nhanh chóng vọt lên hàng chục, thậm chí hàng trăm triệu Nhân dân tệ.

Để giảm chi phí, các công ty có hai cách: một là mua các gói thuê bao tháng (nhưng thường không đủ cho dự án lớn), hai là tự vận hành các mô hình mã nguồn mở để tiết kiệm phí mua ngoài. Tuy nhiên, chi phí phần cứng không hề rẻ, và những mô hình mạnh nhất hiện nay vẫn chưa mở mã nguồn.

Cân nhắc kỹ, tôi đoán rằng hầu hết các công ty chắc chắn sẽ đặt ra giới hạn, không cho phép lập trình viên sử dụng các mô hình bên ngoài một cách vô tội vạ. Chi phí Token khổng lồ đó đơn giản là không thể gánh nổi. Lương lập trình viên vốn đã cao, cộng thêm vài triệu Nhân dân tệ tiền Token mỗi năm cho mỗi người, chi phí phát triển của công ty sẽ bùng nổ mất kiểm soát.

Thực tế, tôi đã biết vài trường hợp các công ty phải thắt chặt việc dùng AI lập trình vì chi phí quá cao.

Ví dụ, gã khổng lồ gọi xe Uber đã tiêu sạch ngân sách AI 3,4 tỷ USD của cả năm 2026 chỉ trong 4 tháng đầu năm cho Claude Code, và buộc phải hạn chế sử dụng.

Hay như Microsoft cũng vừa từ bỏ Claude Code vì vượt ngân sách, chuyển sang dùng mô hình OpenAI do chính họ tự vận hành.

Nếu những ông lớn như Uber hay Microsoft còn không chịu thấu chi phí Token, thì có lẽ chẳng mấy công ty làm được.

Tóm lại, lập trình với AI nghe thì rất triển vọng, nhưng khi nhìn vào hóa đơn, các công ty sẽ tỉnh ngộ: AI lập trình đang đắt đỏ hơn nhiều so với lập trình viên là con người.

Vậy AI có thay thế lập trình viên không? Với những công ty có dự án phần mềm lớn, tôi nghĩ là sẽ không có chuyện thay thế quy mô lớn, đơn giản vì bài toán chi phí. Ít nhất là ở giai đoạn hiện tại, trừ khi trong tương lai chi phí Token giảm mạnh, lúc đó chúng ta mới có chuyện để bàn tiếp.

Dấu chấm hết cho các chương trình săn tiền thưởng lỗ hổng

Turso là một cơ sở dữ liệu đám mây mã nguồn mở trên GitHub.

Họ từng có một chương trình Bug Bounty, tặng 1.000 USD cho ai phát hiện ra lỗ hổng. Mọi thứ vốn dĩ rất ổn, cho đến khi các mô hình ngôn ngữ lớn (LLM) bắt đầu được dùng để tìm lỗi.

Trang PR (Pull Request) của họ giờ trông như thế này.

Những người nộp lỗi tràn lan, tất cả đều nhắm vào tiền thưởng. Cái gọi là “lỗ hổng” của họ thường chỉ là cố tình tiêm vào các byte rác hoặc sai sót trong cấu hình, khiến hệ thống không thể chạy nổi.

Đội ngũ phát triển kiệt sức vì bị làm phiền. Đôi khi, khi đóng các PR này lại, người nộp vẫn tiếp tục tranh cãi, dùng AI tạo ra những bài luận dài dằng dặc để bảo rằng “tôi không sai, các anh nhầm rồi”, thật dở khóc dở cười.

Cuối cùng, đội ngũ phát triển buộc phải thông báo chấm dứt chương trình Bug Bounty. Việc nộp lỗi và PR sẽ không còn tiền thưởng nữa.

Những kẻ tạo ra nội dung rác có thể chỉ mất một phút để nộp bài, nhưng chúng tôi phải mất hàng giờ để đọc, hiểu và phản hồi. Và tốc độ tạo ra loại nội dung này là vô tận.

Dù có thể dùng script tự động để lọc PR, nhưng vì có tiền thưởng nên động lực nộp code AI là quá lớn. Luôn có những người tranh cãi không ngừng hoặc mở lại cùng một PR nhiều lần.

Điều này cho thấy, các chương trình Bug Bounty truyền thống có lẽ sẽ không còn hiệu quả trong thời đại AI. Sau này, việc phát hiện lỗ hổng có thể sẽ không còn tiền thưởng. Không biết điều này có dẫn đến việc gia tăng các vụ tấn công trực tuyến hay không.

Tin tức công nghệ

Cân nặng và nhiệt độ

Một đội thám hiểm từ Đại học Yale phát hiện ra rằng loài khỉ cú ở Argentina đang nặng hơn so với 25 năm trước. Năm 2023, cân nặng trung bình của chúng tăng thêm 50 gram so với năm 1999, tương đương mức tăng 4%.

Các nhà khoa học tin rằng điều này liên quan đến việc nhiệt độ tăng cao. Năm 1999, nhiệt độ trung bình ngày tại Argentina là 22,2 độ C, đến năm 2023 đã lên tới 23,8 độ C.

Nhiệt độ tăng khiến lũ khỉ giảm bớt năng lượng tiêu hao để điều hòa thân nhiệt, nhờ đó có thêm calo dư thừa để tăng cân. Lý thuyết này dường như cũng đúng với con người: biến đổi khí hậu có thể khiến chúng ta dễ béo hơn.

Vỏ trứng nhân tạo

Công ty công nghệ sinh học Colossal đã chế tạo ra “vỏ trứng nhân tạo” và ấp thành công 26 chú gà con.

Lớp vỏ ngoài là một cấu trúc hình chén lục giác vững chắc để hỗ trợ; bên trong là một lớp màng bán thấm cho phép oxy đi qua dễ dàng nhưng vẫn giữ được độ ẩm. Các nhà nghiên cứu đặt phôi gà vào “vỏ trứng” này và ấp thành công trong lồng ấp.

Như trong hình, phần trên của vỏ trứng trong suốt giúp quan sát được tình trạng bên trong. Mục tiêu của Colossal khi tạo ra thiết bị này là để hồi sinh loài chim Dodo đã tuyệt chủng. Nếu không, ngay cả khi tạo ra được phôi nhân bản của chim Dodo, người ta vẫn phải đặt nó vào cơ thể các loài động vật khác (như đà điểu) để sinh sản.

Phản kháng bằng nghệ thuật

Tại Sofia, thủ đô Bulgaria, có một “ổ gà” trên đường mà chính quyền thành phố mãi không chịu sửa. Hai nghệ sĩ cảm thấy bất bình đã vẽ graffiti hình một khuôn mặt ma quỷ đang giận dữ ngay tại đó.

Những hình vẽ rực rỡ giúp tài xế và người đi bộ dễ chú ý hơn, giảm thiểu tai nạn. Đồng thời, nó cũng thu hút sự quan tâm của công chúng và giới truyền thông, khiến cái ổ gà nhanh chóng được lấp lại.

Câu chuyện này cho thấy, sự bất mãn cần được bày tỏ để thúc đẩy giải quyết vấn đề. Và nếu diễn đạt bằng hình thức nghệ thuật, hiệu quả sẽ tốt hơn và dễ được mọi người chấp nhận hơn.

Bài viết

Tại sao RAM tăng giá? (Tiếng Anh)

Các hãng sản xuất ba loại bộ nhớ: DDR (cho PC), LPDDR (cho điện thoại) và HBM (băng thông cao cho máy chủ AI). Vì nhu cầu HBM của các công ty AI tăng vọt với giá hời, các nhà sản xuất đã dồn nguồn lực sang HBM, cắt giảm sản lượng DDR và LPDDR, dẫn đến tình trạng khan hiếm và tăng giá linh kiện cho thiết bị tiêu dùng.

Bắt đầu với Reticulum (Tiếng Anh)

Reticulum là dự án tự xây dựng mạng lưới (mesh network), cho phép thiết lập mạng ảo trên nhiều nền tảng vật lý khác nhau như WiFi, Ethernet, sóng vô tuyến hay LoRa. Bài viết này là một lời giới thiệu ngắn gọn.

Làm nóng chiếc MacBook của bạn (Tiếng Anh)

Một bài viết khá thú vị. Hệ điều hành Mac có lệnh stress dùng để ép CPU chạy tối đa công suất. Tác giả gợi ý có thể dùng lệnh này để làm nóng vỏ kim loại lạnh ngắt của MacBook vào mùa đông.

Tại sao tôi phản đối logic Boolean (Tiếng Anh)

Một bài viết mang tính triết học. Logic Boolean chỉ có hai giá trị: Đúng và Sai. Tác giả cho rằng điều này dẫn đến tư duy nhị nguyên đen trắng, trong khi thế giới thực vốn đầy rẫy những bất định và không hề duy nhất.

Tại sao Định lý giới hạn trung tâm lại ở khắp mọi nơi? (Tiếng Anh)

Bài viết phổ biến kiến thức về lịch sử và ý nghĩa của Định lý giới hạn trung tâm (Central Limit Theorem). Định lý này phát hiện ra quy luật phân phối của giá trị trung bình mẫu, một yếu tố cực kỳ quan trọng trong thống kê.

Công cụ

DOCX Editor

Trình chỉnh sửa file docx trực tiếp trên web, mã nguồn mở, hỗ trợ WYSIWYG.

DvnIP

Dịch vụ IP động, miễn phí cho người dùng cá nhân.

Graphite

Một ứng dụng web vẽ vector mã nguồn mở.

Hindsight

Công cụ dòng lệnh quét repo git cục bộ để tạo heatmap đóng góp cá nhân theo phong cách GitHub.

NyaTerm

Ứng dụng desktop đa nền tảng, tích hợp SSH, terminal, quản lý file từ xa, port forwarding và backup cấu hình trong một không gian làm việc.

diving-rs

Công cụ dòng lệnh hiển thị danh sách file của từng layer bên trong docker image.

CanvasCast

Ứng dụng web quay phim bảng trắng, cho phép vẽ, thuyết trình và ghi lại ngay trong trình duyệt.

Echo Loop

Ứng dụng luyện nghe nói tiếng Anh mã nguồn mở.

Vue TUI

Thư viện component cho terminal dựa trên Vue, có thể dùng để phát triển agent.

witr

Công cụ dòng lệnh hiển thị câu lệnh tương ứng với từng tiến trình đang chạy, hỗ trợ truy vấn theo tên lệnh hoặc số hiệu cổng (port).

AI

DeepSeek Reasonix

Agent lập trình AI trên terminal dành riêng cho DeepSeek, tận dụng cơ chế bộ nhớ đệm để giảm chi phí tối đa.

FunASR

Bộ công cụ nhận dạng giọng nói cấp công nghiệp của Alibaba DAMO Academy, vừa ra mắt công cụ nhập liệu giọng nói trên desktop.

FunClip: Công cụ cắt video thông minh bằng từ khóa.
SenseVoice: Công cụ hiểu giọng nói, có thể nhận diện ngôn ngữ, cảm xúc và các sự kiện âm thanh.

Codex Mate

Bảng quản lý AI agent lập trình cục bộ tất cả trong một, hỗ trợ Codex, Claude Code, Gemini CLI, CodeBuddy, OpenClaw.

Tài nguyên

Vi tích phân thực ra rất dễ

Bản dịch tiếng Trung không chính thức của cuốn sách giáo khoa nổi tiếng “Calculus Made Easy”, một cuốn sách nhập môn vi tích phân rất dễ đọc.

Toàn cảnh 3D Tiểu Tây Thiên

Chuyến tham quan 3D trực tuyến các tác phẩm điêu khắc treo tại Tiểu Tây Thiên, huyện Tập, tỉnh Sơn Tây.

Trắc nghiệm ngôn ngữ C

Một bộ câu hỏi trắc nghiệm về cú pháp ngôn ngữ C.

Hình ảnh

Bảo tàng máy tính bỏ túi

Tại Đức có một bảo tàng trực tuyến chuyên sưu tập các loại máy tính bỏ túi, trong đó có những mẫu máy tính điện tử rất kỳ lạ.

Trích đoạn

Con mồi của kinh tế học hành vi

Dan Ariely, một chuyên gia kinh tế học hành vi, một ngày nọ tình cờ dạo qua trang web của tờ The Economist. Trên trang đăng ký, ông thấy có ba lựa chọn:

A. Bản điện tử — 59 USD. B. Bản in — 125 USD. C. Bản in + Bản điện tử — 125 USD.

Ông khựng lại. Giá của B và C giống hệt nhau. Một cái chỉ có bản in, một cái có cả hai. Ai lại chọn B? Ngay cả người khờ nhất cũng không. Nhưng Ariely không cười, ông nhận ra ngay đây là một thiết kế thiên tài.

Ông mang ba lựa chọn này vào lớp học tại MIT và làm thí nghiệm với 100 sinh viên. Kết quả: 16% chọn A, 0% chọn B, 84% chọn C. Tổng doanh thu: 11.444 USD. Đúng như dự đoán, không ai chọn B.

Sau đó, Ariely làm một việc nhỏ: ông xóa bỏ lựa chọn B, chỉ để lại A và C. Về mặt logic, xóa đi một thứ không ai chọn sẽ không ảnh hưởng đến kết quả, đúng không?

Nhưng kết quả lại là: 68% chọn A, 32% chọn C. Tổng doanh thu sụt giảm xuống còn 8.012 USD.

Đó chính là vai trò của lựa chọn B. Nó chưa bao giờ được ai chọn, tự thân nó không bán được bản nào, nhưng nó âm thầm giúp gói C đắt nhất bán chạy hơn 52%. Chỉ bằng sự “tồn tại” của mình, nó giúp tòa soạn kiếm thêm 3.432 USD. Đây chính là “hiệu ứng chim mồi” nổi tiếng trong kinh tế học hành vi.

Nguyên lý rất đơn giản: Con người không giỏi phán đoán “giá trị tuyệt đối” của một thứ, nhưng cực kỳ giỏi thực hiện “so sánh tương đối”. Khi chỉ có hai lựa chọn 59 USD và 125 USD, nhà bạn so sánh “Rẻ vs Đắt”, và đa số chọn rẻ. Nhưng khi cái mồi “125 USD chỉ mua được bản in” xuất hiện, não bạn bắt đầu so sánh B và C thay vì A và C. Cùng mức giá đó mà C có thêm bản điện tử. Trời ơi, kèo thơm quá! Và thế là bạn hài lòng chọn C.

Bạn không hề biết mình vừa chi thêm 66 USD để mua một cuốn tạp chí giấy mà có thể cả đời bạn chẳng bao giờ lật ra xem.

Chiêu trò này giờ đây có ở khắp nơi. Cỡ vừa của ly cà phê được đặt ra chỉ để bạn thấy cỡ lớn “hời hơn”. Thẻ tháng của các web xem phim đắt đến mức bạn thấy mua thẻ năm “không mua là lỗ”. Khi bạn cảm thấy mình vừa hời, phần lớn là vì ai đó đã khéo léo đặt một “con mồi” để bạn tự nguyện bước vào cánh cửa đắt tiền hơn.

Trích dẫn

1. Nhiều người không thấy được tiềm năng thay đổi thế giới của AI vì họ không hiểu rằng vạn vật đều là thuật toán. Cụ thể hơn, họ không nhận ra rằng xã hội và các công ty chẳng qua chỉ là một tập hợp các thuật toán. — 《Công ty chẳng qua chỉ là một biểu đồ thuật toán》

2. Để đối phó với việc “đầu độc gói phần mềm”, hiện nay có một cách phổ biến là đặt thời gian chờ (cool-down) cho các gói mới phát hành. Người dùng thông thường chỉ có thể cài đặt sau khi hết thời gian này. Cơ chế này chống lại các cuộc tấn công chuỗi cung ứng khá tốt, nhưng có một vấn đề hóc búa: nó phụ thuộc vào việc có những người khác cài đặt trước. Vậy tìm đâu ra những người sẵn sàng làm “chuột bạch” thử nghiệm mọi gói mới ngay lập tức? — 《Các gói phần mềm nên được triển khai theo giai đoạn》

3. AI có thể mang lại giáo dục cá nhân hóa một kèm một với hiệu quả tốt hơn, khiến đại học trở nên vô giá trị đối với nhiều người. — Sam Altman, CEO của OpenAI

4. Những nhà quản lý cấp trung không am hiểu kỹ thuật, những người chưa từng viết một dòng code nào, giờ đây cảm thấy rào cản lớn nhất dẫn đến thành công đã biến mất. Họ không còn phải đối phó với những lập trình viên phiền phức nữa, có thể tự thay đổi giao diện web hay tính năng mà không cần họ. Hơn nữa, AI không phàn nàn, không lập công đoàn, cũng chẳng biểu tình; nó chỉ phục tùng mọi mệnh lệnh. — 《AI sẽ đưa chúng ta về đâu》

5. Một lý do tôi thích PHP là vì các biến của nó bắt đầu bằng ký hiệu đô la ($), điều này nhắc nhở bạn mục đích bạn sử dụng nó để làm gì. — 《Những điểm kỳ lạ của PHP》