Issue • #363 • Đọc 12 phút

Cách giải thích mạng thần kinh dễ hiểu nhất

Mạng thần kinh (neural network) chính là nền tảng thuật toán của AI hiện đại. Mới đây, tôi đọc được một bài viết trên tạp chí khoa học Quanta Magazine (Mỹ).

Cách giải thích mạng thần kinh dễ hiểu nhất

Ảnh bìa

Một “hiệu sách vách núi” độc đáo được xây dựng lưng chừng núi tại khu thắng cảnh Thiên Khanh, huyện La Thành, thành phố Hà Trì, Quảng Tây. Một khung cảnh thực sự hùng vĩ. (via)

Cách giải thích mạng thần kinh dễ hiểu nhất

Mạng thần kinh (neural network) chính là nền tảng thuật toán của AI hiện đại.

Mới đây, tôi đọc được một bài viết trên tạp chí khoa học Quanta Magazine (Mỹ). Họ dùng một ví dụ cực kỳ đơn giản kèm theo hình minh họa để giải thích về mạng thần kinh. Đây có lẽ là tài liệu dễ hiểu nhất mà tôi từng thấy về chủ đề này. Dưới đây là phiên bản tiếng Việt mà tôi đã lược thuật lại.

Giả sử trong máy tính của bạn có một đống ảnh, và bạn muốn tìm ra những bức ảnh có con mèo. Bạn làm thế nào? Thực tế, đây là một bài toán phân loại máy (machine classification). Máy tính cần chia ảnh thành hai loại: một loại là mèo, và loại còn lại không phải mèo.

Hãy tưởng tượng vấn đề này giống như một tấm bản đồ với một đường ranh giới ở giữa, chia bản đồ thành hai quốc gia. Nhiệm vụ của bạn là xác định chính xác vị trí của đường ranh giới đó. Khi đó, với bất kỳ điểm nào, bạn sẽ biết nó nằm ở bên trái hay bên phải ranh giới.

Điều kiện đã biết là vị trí của nhiều điểm trên bản đồ. Như hình trên, các điểm hình tam giác thuộc quốc gia A, các điểm hình vuông thuộc quốc gia B. Việc của bạn là từ những điểm này để suy ra đường ranh giới.

Chúng ta có thể thiết lập một hàm toán học (điểm N trong hình) để xử lý việc này. Hàm này nhận vào hai tham số là tọa độ x và y của mỗi điểm, và trả về một giá trị từ 0 đến 1, đại diện cho xác suất điểm đó thuộc về quốc gia mục tiêu.

Bạn dùng các điểm đã biết để “huấn luyện” hàm này. Máy tính sẽ tự động dựa trên sai số của mỗi lần huấn luyện để điều chỉnh trọng số của các tham số, cuối cùng tìm ra một đường ranh giới gần đúng nhất.

Đường ranh giới thẳng tắp chỉ là trường hợp lý tưởng. Trong thực tế, ranh giới thường là những đường cong lắt léo.

Lúc này, chỉ dùng một hàm để xác định ranh giới là không đủ. Bạn cần nhiều hàm khác nhau để phán đoán từ nhiều góc độ.

Quá trình phán đoán thậm chí cần thực hiện theo từng giai đoạn, tức là cần nhiều lớp hàm. Mạng lưới các hàm này rất giống với hệ thần kinh của con người, nên được gọi là mạng thần kinh. Mỗi hàm đóng vai trò như một nơ-ron thần kinh trong mạng lưới.

Bây giờ quay lại với bức ảnh con mèo. Chúng ta cũng cần thiết lập một hàm để phán đoán xác suất bức ảnh đó là mèo. Nếu hàm ranh giới bản đồ chỉ cần 2 tham số X và Y, thì hàm nhận diện mèo cần “đọc” toàn bộ bức ảnh. Nếu ảnh có kích thước 2500 pixel, hàm đó sẽ cần tới 2500 tham số.

Số lượng tham số của hàm có thể coi là số chiều của không gian. 2 tham số là không gian 2 chiều, 2500 tham số là không gian 2500 chiều. Hàm nhận diện mèo chính là việc tìm ra một “đường ranh giới” trong không gian 2500 chiều đó thông qua việc huấn luyện với dữ liệu khổng lồ, từ đó tính toán xem một bức ảnh bất kỳ nằm ở phía nào của ranh giới với xác suất bao nhiêu.

Tin tức công nghệ

Thành phố Thanh Đảo (Trung Quốc) vừa đưa vào sử dụng tòa nhà “không phát thải carbon” đầu tiên trên thế giới, sử dụng 100% năng lượng xanh.

Tòa nhà cao 117 mét với 23 tầng. Toàn bộ vách kính bên ngoài là kính quang điện, có thể tạo ra 1500 số điện mỗi ngày.

Điều thú vị nhất là tòa nhà có một phòng năng lượng dưới lòng đất lưu trữ 14 chiếc xe điện đã hết hạn sử dụng. Pin của chúng được dùng để tích trữ năng lượng phục vụ giờ cao điểm. Ngoài ra, xe điện của nhân viên khi đỗ trong hầm cũng có thể kết nối với lưới điện tòa nhà để cấp điện ngược lại và nhận phí bồi hoàn.

Đại học Y Quảng Châu đã thực hiện thành công ca ghép phổi lợn lên cơ thể người đầu tiên trên thế giới.

Họ đã ghép một lá phổi lợn được chỉnh sửa 6 đoạn gen vào cơ thể một bệnh nhân đã chết não. Ban đầu, lá phổi hoạt động tốt, cung cấp oxy và thải CO2. Tuy nhiên, sau 24 giờ, nội tạng bắt đầu có dấu hiệu tổn thương và xuất hiện phản ứng thải ghép vào ngày thứ 3 và thứ 9. Gia đình bệnh nhân đã đồng ý kết thúc thí nghiệm vào ngày thứ 9. Kết quả bước đầu rất đáng khích lệ, dù vẫn còn những ý kiến trái chiều về việc liệu phổi lợn có thể duy trì sự sống độc lập hay không.

Một người Hàn Quốc đã phát minh ra chiếc dập ghim 90 độ, có thể dập ghim theo góc vuông.

Loại dập ghim này giúp tiết kiệm diện tích giấy chồng lên nhau ở các góc và loại bỏ nhu cầu sử dụng băng dính hay keo dán.

Framework, thương hiệu laptop nổi tiếng với thiết kế mô-đun, vừa ra mắt dòng máy có thể thay thế cả CPU và GPU.

Đây có lẽ là chiếc laptop đầu tiên trên thế giới cho phép thay thế card đồ họa dễ dàng như vậy.

Người dùng chỉ cần mở nắp sau và rút mô-đun GPU ra để nâng cấp. Đây là một hướng đi tuyệt vời giúp giảm thiểu rác thải điện tử.

Một luật sư người Mỹ đề xuất rằng pháp luật nên thiết lập “quyền thừa kế kỹ thuật số” cho người quá cố để bảo vệ dữ liệu cá nhân của họ. Hiện nay, hầu hết mọi người khi qua đời không để lại di chúc về việc xử lý các nội dung họ tạo ra trên internet. Luật sư này cho rằng cần có quy định ngăn chặn các nền tảng sử dụng dữ liệu của người đã khuất để huấn luyện AI mà không có sự đồng ý của người thừa kế.

Bài viết

Google công bố chương trình xác thực nhà phát triển Android (Tiếng Anh)

Android vốn cho phép tự cài đặt ứng dụng từ bên ngoài cửa hàng. Tuy nhiên, Google dự định thay đổi điều này bằng cách yêu cầu tất cả tác giả ứng dụng phải được xác thực danh tính từ tháng 9 năm tới.

Tại sao giao thức OAuth lại được thiết kế như vậy? (Tiếng Anh)

OAuth là giao thức đăng nhập bên thứ ba khá phức tạp. Bài viết giải thích chi tiết lý do đằng sau từng bước thiết kế, giúp người đọc nắm bắt bản chất của nó một cách dễ dàng.

Hàm random() trong CSS (Tiếng Anh)

Giới thiệu cách sử dụng hàm tạo số ngẫu nhiên mới của CSS để tạo ra các hiệu ứng như bầu trời sao hay vòng quay may mắn chỉ bằng mã CSS thuần túy.

So sánh Portainer và Dockge (Tiếng Anh)

Khi quản lý nhiều container Docker, bạn sẽ cần đến các công cụ quản trị. Bài viết so sánh hai công cụ phổ biến nhất hiện nay là Portainer và Dockge.

Cách xem thông tin tiến trình trên máy Mac (Tiếng Anh)

Lệnh fs_usage tích hợp sẵn trên macOS là một công cụ mạnh mẽ để theo dõi xem các tiến trình đang thực hiện thao tác gì trên các tệp tin hệ thống.

Biến Kindle cũ thành bảng điều khiển cá nhân (Tiếng Anh)

Một cách tận dụng tuyệt vời những chiếc máy đọc sách Kindle đời cũ bằng cách biến chúng thành màn hình hiển thị thông tin thời tiết, lịch trình.

Công cụ

Gonzo

Công cụ xem tệp log ngay trong terminal cực kỳ tiện lợi.

Filestash

Trình quản lý tệp tin trên nền web hỗ trợ đa dạng các giao thức và dịch vụ lưu trữ đám mây như S3, FTP, WebDAV, Git và MySQL.

Anchor Relay

Trang web hỗ trợ tạo chứng chỉ HTTPS miễn phí.

PlutoPrint

Thư viện Python giúp chuyển đổi mã nguồn hoặc trang web HTML thành tệp PDF chất lượng cao.

MarkFlowy

Trình chỉnh sửa Markdown đa nền tảng tích hợp hỗ trợ AI và hoàn toàn mã nguồn mở.

Pixel Art Generator

Công cụ trực tuyến giúp biến bất kỳ bức ảnh nào thành tranh pixel chỉ với một cú nhấp chuột.

Peek Pop

Tiện ích trình duyệt cho phép xem trước nội dung trang web ngay khi di chuột vào liên kết.

naive-ui-pro

Giải pháp giao diện quản trị dựa trên Vue 3 và Vite.

File Transfer Go

Ứng dụng web truyền tệp tin P2P dựa trên công nghệ WebRTC, đảm bảo tốc độ và tính riêng tư.

Dataset Viewer

Trình xem tệp tin trên máy tính hỗ trợ hầu hết các định dạng phổ biến, giúp xem nhanh các tệp lớn hoặc tệp nén mà không cần giải nén.

Calligraphy Generator

Công cụ tạo các mẫu tập viết chữ Hán có kèm theo phiên âm và ô kẻ ô chữ Mễ.

Web Serial Assistant

Ứng dụng web hỗ trợ gỡ lỗi cổng nối tiếp (serial port) tương thích với nhiều dòng vi điều khiển và thiết bị IoT.

AI

DeepWiki

Dịch vụ biến các kho mã nguồn trên GitHub thành một trang Wiki chi tiết, giải thích cặn kẽ cách vận hành của mã nguồn.

Daily Commit Summarizer

Mẫu GitHub Actions giúp tự động tạo báo cáo tóm tắt các thay đổi mã nguồn hàng ngày và gửi về các ứng dụng nhắn tin công việc.

VideoAdGuard

Tiện ích trình duyệt sử dụng AI để tự động nhận diện và bỏ qua các đoạn quảng cáo được chèn trực tiếp trong video.

Tài nguyên

Atlas of Space

Bản đồ hệ mặt trời trực tuyến hiển thị chuyển động thời gian thực của các hành tinh.

all text in nyc

Một dự án thú vị sử dụng công nghệ nhận diện chữ viết trên ảnh đường phố New York, cho phép bạn tìm kiếm xem một từ bất kỳ xuất hiện ở đâu trên các biển báo tại thành phố này.

Mechanical Library

Trang web giới thiệu chi tiết về nguyên lý hoạt động của các cơ cấu cơ khí phổ biến.

Is this tech dead?

Trang web đánh giá mức độ “sống còn” của một công nghệ dựa trên các chỉ số về lượt tìm kiếm và tần suất cập nhật mã nguồn.

Hình ảnh

Nhà ga kỳ quái nhất Nhật Bản

Ga Doai nằm ở biên giới hai tỉnh Gunma và Niigata là một nhà ga không người trực, nổi tiếng với bầu không khí rùng rợn.

Nhà ga nằm sâu trong lòng núi. Từ cổng vào, hành khách phải đi bộ xuống 462 bậc thang dài tới 338 mét để xuống tới sân ga.

Không gian sân ga luôn u ám với tiếng nước chảy ngầm róc rách.

Trên sân ga chỉ có một phòng chờ nhỏ và một nhà vệ sinh đơn sơ. Những dòng tin nhắn và ảnh chụp của du khách để lại trong phòng chờ càng làm tăng thêm vẻ ma mị cho nơi này, khiến người ta liên tưởng đến khung cảnh trong trò chơi Silent Hill.

Trích đoạn

1. Sự thoải mái quá mức đang làm chúng ta yếu đi

Khái niệm “hormesis” trong y sinh học chỉ ra rằng một lượng nhỏ áp lực hoặc sự khó chịu thực tế lại làm sinh vật trở nên mạnh mẽ hơn. Việc nâng tạ giúp cơ bắp phát triển, tiêm vắc-xin giúp tăng cường miễn dịch, và việc giải quyết các bài toán khó giúp trí tuệ mở rộng.

Thế nhưng, với sự xuất hiện của AI, nhiều người đang chọn cách giao phó mọi suy nghĩ cho máy móc. Một nghiên cứu gần đây cho thấy 83% những người dùng AI để viết luận văn đã không thể nhớ nổi nội dung chính trong chính bài viết của mình ngay sau khi hoàn thành. Các nhà nghiên cứu gọi đây là “nợ nhận thức”: AI mang lại sự tiện lợi tức thời nhưng cái giá phải trả là sự suy giảm khả năng tư duy độc lập.

Lời khuyên của tôi là hãy sử dụng AI một cách khôn ngoan. Đừng để nó giải hộ bạn một phương trình toán học, mà hãy để nó kiểm tra đáp án của bạn và giải thích xem bạn sai ở đâu. Sự khó chịu khi phải suy nghĩ chính là quá trình rèn luyện cho bộ não.

Trích dẫn

Tôi nghĩ TSMC là một trong những công ty tốt nhất trong lịch sử nhân loại. Bất kỳ ai muốn mua cổ phiếu của TSMC đều là những người cực kỳ thông minh.

— Jensen Huang, CEO của Nvidia, khi được hỏi về việc chính phủ Mỹ có thể mua cổ phần của TSMC. Một câu trả lời khéo léo không làm mất lòng ai.

Một hệ thống phân tán không nhất thiết phải nằm trên nhiều máy tính khác nhau, mà là một hệ thống bao gồm từ hai tiến trình tương tác trở lên, bất kể chúng nằm trên cùng một máy chủ hay không.

— Hệ thống phân tán là gì?

Các mô hình ngôn ngữ lớn thực chất là một cách nén thông tin. Dù có lúc không chính xác hay xảy ra “ảo giác”, nó vẫn là một cái nhìn nén có giá trị về toàn bộ internet.

— Trọng số của LLM là một phần của lịch sử

Trước đây, viết phần mềm tốt hơn là làm thủ công. Bây giờ, viết prompt cho AI lại tốt hơn là viết phần mềm.

— Lập trình bằng Prompt

Khi mô hình Whisper của OpenAI chuyển giọng nói trong các video tiếng Trung thành văn bản, ở những đoạn im lặng, nó thường tự động chèn dòng chữ “Chỉ dùng cho học tập/nghiên cứu, vui lòng xóa sau 48 giờ”. Điều này cho thấy mô hình đã được huấn luyện dựa trên rất nhiều dữ liệu phụ đề từ các cộng đồng làm sub lậu.

— Một độc giả trên Hacker News