Phát hiện các gian lận kế toán bằng phương pháp máy học tổng hợp
Phát hiện các gian lận kế toán bằng phương pháp máy học tổng hợp
CH2002011 - Huỳnh Thị Tố Ngọc
Báo cáo tài chính (viết tắt là BCTC) là công cụ giúp các nhà đầu tư và những đơn vị liên quan hiểu rõ tài chính của các tổ chức. Trong thời đại ngày nay, tốc độ phát triển của khoa học công nghệ nhanh như vũ bão thì quy mô kinh doanh ngày càng tăng, nguy cơ về gian lận kế toán (GLKT) đã trở thành một thách thức cực kỳ lớn đối với doanh nghiệp và hệ thống tài chính toàn cầu. GLKT không còn đơn thuần là một vấn đề riêng của các doanh nghiệp, mà còn mang theo những hậu quả lớn đối với tính công bằng và minh bạch trong quản lý tài chính. Việc GLKT ngày càng trở nên tinh vi làm cho việc phát hiện và ngăn chặn gian lận trở nên cực kỳ khó khăn.
Trong luận văn này, chúng tôi đã tiến hành trích xuất đặc trưng từ các giá trị dữ liệu thô trong các BCTC và áp dụng phương pháp máy học tổng hợp với thuật toán RUSBoost, AdaBoost, Bagging, phương pháp máy học hồi quy Logistic và SVM để xây dựng mô hình phân loại các GLKT.
Chúng tôi đã tập trung giải quyết hai vấn đề chính. Thứ nhất, đã đóng góp về mặt tập dữ liệu, bổ sung tập dữ liệu cho nghiên cứu khoa học về GLKT từ các BCTC. Thứ hai, qua kết quả số liệu của mô hình thực nghiệm và phân tích số liệu cho thấy kết quả của mô hình máy học tổng hợp tốt hơn so với các mô hình riêng biệt.
Với những kết quả đạt được, đề tài đã phát hiện GLKT trong BCTC và nâng cao độ tin cậy của những BCTC dành cho người sử dụng. Sau khi xây dựng thành công mô hình phát hiện GLKT bằng thuật toán máy học tổng hợp, chúng tôi đề xuất giải pháp tự động hóa quy trình phát hiện GLKT, giảm thiểu sự phụ thuộc vào sự can thiệp của con người. Mục tiêu là tối ưu hóa hiệu suất thời gian, nâng cao độ chính xác, giảm thiểu sai sót do yếu tố con người trong quá trình giám sát, đảm bảo được tính công bằng, minh bạch trong quản lý tài chính và góp phần xây dựng sự ổn định của thị trường kinh doanh và xã hội.
Trân trọng.