Designing Machine Learning Systems: An Iterative Process for Production-Ready Applications
Huyền Chip không chỉ nổi bật trong vai trò của một người truyền cảm hứng cho thế hệ trẻ. Ít ai biết cô gái Việt Nam tài năng này còn là tác giả của quyển sách Machine Learning nổi tiếng nằm trong top best seller ở lĩnh vực công nghệ.
Designing Machine Learning Systems được O’reilly xuất bản tháng 6 năm 2022 lập tức gây được tiếng vang lớn. Thành công này đến từ giá trị nội dung cốt lõi quyển sách mang đến cho độc giả. Những người có mối quan tâm sâu sắc đến Machine Learning (ML).
Cuốn sách này tập trung vào các khía cạnh, tính ứng dụng thực tế của ML thay vì giải thích chuyên sâu về ý nghĩa của nó. Cụ thể, đối với lĩnh vực kinh doanh, sách sẽ giúp bạn giải quyết các tình huống như:
- Lựa chọn dữ liệu phù hợp để giải quyết vấn đề business của doanh nghiệp
- Tự động hóa quy trình để liên tục phát triển, đánh giá, triển khai và cập nhật các mô hình mới
- Phát triển một hệ thống giám sát để nhanh chóng phát hiện và giải quyết các sự cố mà mô hình của bạn có thể gặp phải trong quá trình sản xuất
- Xây dựng một nền tảng ML phục vụ cho nhiều trường hợp khác nhau
- Phát triển các hệ thống ML mang tính trách nhiệm
Bạn cũng có thể nhận được giá trị từ cuốn sách nếu thuộc một trong các nhóm sau:
- Các Developer muốn tìm kiếm cơ hội tạo ra công cụ liên quan đến hệ sinh thái ML
- Các cá nhân đang tìm kiếm các vị trí liên quan đến ML.
- Các vị trí kỹ thuật cấp cao và kinh doanh đang xem xét áp dụng các giải pháp ML để cải thiện sản phẩm và/hoặc quy trình kinh doanh.
- Độc giả không có nền tảng kỹ thuật vững chắc vẫn có thể tiếp cận ML theo hướng phù hợp nhất.
Probabilistic Machine Learning: An Introduction (Adaptive Computation and Machine Learning series)
Kevin P. Murphy là Nhà khoa học nghiên cứu tại Google ở Mountain View, California. Nơi ông làm việc về trí tuệ nhân tạo (AI), học máy (Machine Learning), thị giác máy tính…
Tháng 3 năm 2022, cuốn sách Probabilistic Machine Learning được xuất bản với bản bìa cứng dài 864 trang. Đúng như một phần tên gọi: An Introduction (Adaptive Computation and Machine Learning series). Quyển sách cung cấp chuyên sâu và chi tiết về ML. Được trình bày qua lăng kính của mô hình xác suất và lý thuyết Bayes.
Cuốn sách bao gồm:
- Nền tảng toán học, bao gồm đại số tuyến tính và tối ưu hóa
- Học có giám sát cơ bản, bao gồm hồi quy tuyến tính (linear regression), logistic và mạng lưới thần kinh sâu (deep neural networks)
- Các chủ đề nâng cao hơn (bao gồm học tập chuyển đổi ( transfer learning) và học tập không giám sát (Unsupervised Learning)
Ngoài ra, cuốn sách mới còn kèm theo code Python trực tuyến, sử dụng các thư viện như scikit-learn, JAX, PyTorch và Tensorflow, có thể được sử dụng để tái tạo gần như tất cả các số liệu. Code này có thể chạy bên trong trình duyệt web bằng cloud-based notebooks và cung cấp phần bổ sung thiết thực cho các chủ đề lý thuyết được thảo luận trong cuốn sách.
Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow
Aurélien Géron là một nhà tư vấn về Machine Learning. Ngoài việc từng là nhân viên của Google, Youtube. Anh cũng là người sáng lập và là CTO của Wifirst và Polyconseil, những công ty chuyên về Internet và viễn thông.
Trước khi quyển sách Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow ra đời. Anh đã xuất bản một vài cuốn sách kỹ thuật về kiến trúc C++, WiFi và Internet. Đồng thời là giảng viên Khoa học Máy tính tại một trường kỹ thuật của Pháp.
Cuốn sách này giả định rằng bạn hầu như không biết gì về Machine Learning. Mục tiêu của nó là cung cấp cho bạn các khái niệm, công cụ và trực giác mà bạn cần để triển khai các chương trình có khả năng học hỏi từ dữ liệu.
Tuy nhiên, đây là một quyển sách chuyên sâu về ML. Người đọc cần có một lượng hiểu biết về toán cấp đại học (giải tích, đại số tuyến tính, xác suất và thống kê) để có thể hiểu được nội dung mà quyển sách truyền tải.
Scikit-Learn rất dễ sử dụng, nhưng nó triển khai nhiều thuật toán Machine Learning một cách hiệu quả. Do đó, nó tạo ra một điểm khởi đầu tuyệt vời để học Machine Learning.
Keras là một API Deep Learning cấp cao giúp đào tạo và chạy các mạng nơ-ron rất đơn giản. Keras đi kèm với TensorFlow và nó dựa vào TensorFlow cho tất cả các tính toán chuyên sâu.
TensorFlow là một thư viện phức tạp hơn để tính toán số phân tán. Nó cho phép đào tạo và chạy các mạng thần kinh rất lớn một cách hiệu quả bằng cách phân phối các tính toán trên hàng trăm máy chủ đa GPU (đơn vị xử lý đồ họa). TensorFlow (TF) được tạo tại Google và hỗ trợ nhiều ứng dụng Machine Learning quy mô lớn của Google.