✨Mô hình tạo sinh
Trong phân loại bằng thống kê, có hai cách tiếp cận chính là tiếp cận tạo sinh (sinh mẫu) và tiếp cận phân biệt. Hai cách này tính toán các bộ phân lớp (classifier) bằng nhiều cách khác nhau, tùy theo mức độ của mô hình thống kê. Thuật ngữ đặt tên cho các mô hình này không nhất quán, nhưng ba loại chính có thể được phân biệt đó là :
- Cho một biến quan sát (observable variable) X và một biến đích (target variable) Y, một mô hình sinh mẫu là một mô hình thống kê của phân phối xác suất đồng thời (joint probability distribution) trên X × Y, ;
- Một mô hình phân biệt (discriminative model) là một mô hình xác suất có điều kiện của biến đích Y, cho trước một biến quan sát x, ký hiệu, ; và
- Các phân lớp tính toán được tính toán mà không sử dụng mô hình xác suất cũng được gọi một cách ít chặt chẽ là "phân biệt". Việc phân biệt giữa hai lớp cuối cùng này không được thực hiện một cách nhất quán; đề cập đến ba loại này là học tạo sinh, học điều kiện, và học phân biệt, nhưng chỉ phân biệt hai loại, gọi chúng là các phân lớp tạo sinh (phân phối đồng thời) và các phân lớp phân biệt (phân phối có điều kiện hoặc không có phân phối), không phân biệt giữa hai lớp sau. Tương tự, một bộ phân lớp dựa trên một mô hình tạo sinh là một phân lớp tạo sinh, trong khi một bộ phân lớp dựa trên một mô hình phân biệt là một phân lớp phân biệt, mặc dù thuật ngữ này cũng đề cập đến các bộ phân lớp không dựa trên một mô hình.