NGÀNH CNTT TUYỂN SINH NHIỀU CHỈ TIÊU NGÀNH CNTT, CNTT VIỆT NHẬT VÀ KHOA HỌC DỮ LIỆU

Góc học tập

Databases Traceability by Means of Watermarking with Optimized Detection

on .

Chắc hẳn đối với bộ phận công nghệ thông tin hay bộ phận phân tích và phát triển kinh doanh trong mỗi doanh nghiệp, khai niệm kho dữ liệu (data warehouse), dữ liệu lớn (big data), điện toán đám mây (cloud), cơ sở dữ liệu (database) ở các công ty công nghệ không còn quá xa lạ. Với nhu cầu tiếp nhận, phân tích và xử lý dữ liệu dưới góc nhìn đa chiều và tổng hợp như hiện nay, việc thống kê dòng dữ liệu là vô cùng cần thiết, từ đó khái niệm kho dữ liệu ra đời nhằm đảm bảo việc lưu trữ được đầy đủ dữ liệu cũng như nâng cao tốc độ các kết quả trả về của hệ thống. Điện toán đám mây thúc đẩy sự phát triển như vậy cho phép các đối tượng khác nhau hợp tác và giảm chi phí, với khả năng truy cập từ xa và các nhóm tài nguyên lưu trữ hiện đã trở thành hiện thực. Tuy nhiên, những hạn chế quyền truy cập mới này đồng thời gây ra sự gia tăng nhu cầu bảo mật. Trong số đó, truy xuất nguồn gốc dữ liệu có một tầm quan trọng đặc biệt. Thật vậy, cơ sở dữ liệu có thể được định tuyến lại hoặc phân phối lại mà không được cho phép, như được minh họa bằng các vụ rò rỉ thông tin được tiết lộ mỗi năm, ngay cả trong các lĩnh vực nhạy cảm như quốc phòng hoặc chăm sóc sức khỏe và cũng là mối quan tâm lớn của cả doanh nghiệp tư nhân và doanh nghiệp nhà nước.

 

Nhóm thực hiện:

  • Nguyễn Trần Lê – CH2002001
  • Lê Võ Bảo Trân – CH2002020
  • Lê Quang Kỳ – CH2002036

Xem chi tiết tại đây.

 

ỨNG DỤNG GIẢI THUẬT TỐI ƯU BẦY ĐÀN KHAI THÁC TOP-K MẪU HỮU ÍCH CAO

on .

ỨNG DỤNG GIẢI THUẬT TỐI ƯU BẦY ĐÀN KHAI THÁC TOP-K MẪU HỮU ÍCH CAO

Trương Quang Trung - CH1802063

Trong xu thế của nền kinh tế tri thức ngày nay, khi công nghệ thông tin có những bước tiến vượt bậc. Và đã góp mặt ở hầu hết các ngành nghề và không thể thiếu trong kinh doanh, nói đến kinh doanh là nói đến giao dịch mua bán hàng hoá,... Câu hỏi đặt ra là với dữ liệu bán hàng, dữ liệu lớn như vậy (phát sinh hàng ngày, hàng giờ) thì chúng ta có thể khai thác điều gì hữu ích làm cơ sở để hỗ trợ ra quyết định nhằm tối ưu lợi nhuận trong kinh doanh? Từ thực tế đó, khai thác dữ liệu (data mining) đã ra đời, mục tiêu là khai thác dữ liệu đã có, thực hiện quá trình phân loại, sắp xếp các tập hợp dữ liệu để xác định các mẫu và thiết lập các mối liên hệ nhằm giải quyết các vấn đề nhờ phân tích dữ liệu và hướng đi này đã có rất nhiều các công trình nghiên cứu khoa học, tiền đề là khai thác những mẫu xuất hiện thường xuyên trong dữ liệu giao dịch gọi là khai thác mẫu phổ biến.

Bài toán khai thác mẫu phổ biến vốn là một hướng nghiên cứu về khai thác dữ liệu [12] nhằm xác định tập các hạng mục có tần suất xuất hiện cao trong cơ sở dữ liệu giao dịch. Hạn chế là FIM không xét tới số lượng mua các mặt hàng và lợi nhuận của chúng [4]. Để giải quyết khăn của FIM, bài toán khai thác tập mục hữu ích cao (HUIM) được giới thiệu [3],[4]. HUIM không những là một chủ đề được nhiều nhà nghiên cứu quan tâm mà còn là sự quan tâm đặc biệt, nhất là trong khai thác dữ liệu khi đề cập đến việc khai thác các tập mục hữu ích đáp ứng.

Hiện nay nghiên cứu về HUI kết hợp meta-heuristics cũng có khá nhiều, ví dụ như: HUIF-PSO, HUIM-AF, HUIM-HC, HUIM-ACO, HUIF-PS. Tuy nhiên chưa có thuật toán nào áp dụng giải thuật tối ưu bầy đàn kết hợp với TKO (mining Top-k utility itemsets One phase) và TKU (Mining Top-k Utility itemsets) vào việc khai thác Top-k để tìm ra tập hữu ích cao. Lý do chính là do độ hữu ích không thỏa mãn tính chất Apriori (hay còn được biết với tên gọi tính chất bao đóng giảm). Vì vậy, việc tỉa bớt các ứng viên không tiềm năng là không đơn giản như FIM (độ phức tạp thấp) [5], [6]. Bên cạnh đó, khi thực hiện ứng dụng giải thuật tối ưu hoá bầy đàn (PSO) đang nghiên cứu vào khai thác HUIs lại tỏ ra khá hiệu quả để khai thác các tập mục hữu ích cao, khi không phải xử lý vấn đề theo cấp số nhân như thuật toán khai thác HUIs truyền thống, tiết kiệm được thời gian xử lý và bộ nhớ lưu trữ và đây cũng chính là lý do để đề xuất phương pháp mới.

Một trung tâm mua sắm có nhập một lượng mặt hàng rất lớn đến từ nhiều nhà sản xuất khác nhau. Các sản phẩm cửa hàng nhập về được sắp xếp ở nhiều vị trí khác nhau phục vụ cho chiến lược kinh doanh. Những giao dịch khi khách hàng mua sắm gọi là dữ liệu và được lưu dữ lại. Lượng dữ liệu của trung tâm mua sắm là rất lớn. Những nhà lãnh đạo trung tâm này muốn biết sản phẩm hay tập sản phẩm nào mà trung tâm bán ra thu về với nhiều lợi nhuận nhất, đóng góp lợi nhuận cho trung tâm nhiều nhất,… giúp nhà lãnh đạo hiểu rõ hơn về doanh thu và lợi nhuận từ từng nhóm sản phẩm. Dựa trên phân tích các sản phẩm có lợi nhuận cao, người lãnh đạo có thể nhận định được mức độ hiệu quả trong việc kinh doanh các sản phẩm và nhóm sản phẩm. Ngoài ra, tìm kiếm hướng kinh doanh để đạt lợi nhuận mong muốn. Mặt khác cũng giúp cho lãnh đạo nắm bắt được xu hướng thị trường và sự thay đổi trong nhu cầu của khách hàng. Với thông tin này, lãnh đạo có thể đưa ra những quyết định kinh doanh thông minh về việc mở rộng hoặc thu hẹp danh mục hàng hóa, xây dựng và phát triển danh mục các nhóm sản phẩm mang lại lợi nhuận cao.

Kết quả đạt được:

  • Thuật toán tối ưu hóa bầy đàn là một trong những giải pháp đã được quan tâm rất nhiều khi ứng dụng một số bài toán cho kết quả rất tốt. Do đó, với ý tưởng khai thác Top-k mẫu hữu ích cao kết hợp với phương pháp tối ưu hóa PSO thì luận văn cũng đã đạt được kết quả nhất định.
  • Thuật toán Top-k được giới thiệu để khai thác Top-k mẫu hữu ích cao và giới thiệu với hai thuật toán là TKU (TKUBASE) và TKO (TKOBASE). Luận văn thực hiện áp dụng theo thuật toán TKO (TKOBASE) do thuật toán TKO (TKOBASE) được đánh giá là có hiệu quả hơn.
  • Kết quả thực nghiệm nói chung đã cho thấy thuật toán đề xuất cho kết quả rất khả quan, đã tối ưu được bộ nhớ so TKO. Tuy nhiên thuật toán đề xuất chưa thực sự vượt trội về tối ưu về thời gian. Về thuật toán TKU, tác giả trong bài viết [1] đã kết luận thuật toán TKU không cho kết quả tốt hơn so với TKO nên bài luận văn này tập trung so sánh với thuật toán TKO.

Trân trọng.

Khi ứng dụng toán học chưa tính đến khía cạnh con người

on .

LTS: Giải Abel 2021 vừa qua, được trao cho hai nhà toán học Lásaló Lovász và Avi Wigderson vì những nghiên cứu thuộc về ranh giới giữa toán học thuần túy và toán học ứng dụng. Lásaló Lovász chia sẻ trên tạp chí Nature rằng, lằn ranh giữa hai lĩnh vực ngày càng mờ nhạt là một điều tốt. Có thật thế không? GS. Neal Koblitz, một nhà toán học mà lý thuyết của ông về sau trở thành công nghệ cốt lõi trong bảo mật trên internet lại không hoàn toàn nghĩ như vậy. Những định lý toán học thuần túy khi được kéo vào thực tế có thể ẩn chứa những nguy cơ nếu không tính đến những đa dạng chính trị, kinh tế, sắc tộc, văn hóa, định kiến, cảm xúc của con người trong đời sống.


 Lásaló Lovász, đồng chủ nhân của giải Abel 2021 chia sẻ rằng lằn ranh giữa toán học thuần túy và toán học ứng dụng ngày càng mờ đi là một điều tốt. 
Ảnh: Mandiner.hu

CHỐNG LẠI KỸ THUẬT NÉ TRÁNH MÁY ẢO CỦA MÃ ĐỘC TRONG PHÂN TÍCH ĐỘNG

on .

NGHIÊN CỨU PHƯƠNG PHÁP CHỐNG LẠI KỸ THUẬT NÉ TRÁNH MÁY ẢO CỦA MÃ ĐỘC TRONG PHÂN TÍCH ĐỘNG

Phạm Ri Nép - CH2002010

Phần mềm độc hại làm cơ sở cho nhiều hoạt động tội phạm, đặc biệt là các hoạt động tội phạm có động cơ tống tiền như mã độc cũng như các mối đe dọa nâng cao (APT). Trong thời gian gần đây, số lượng và mức độ tinh vi của các ứng dụng độc hại đang gia tăng đáng kể. Để hiểu được hoạt động của phần mềm độc hại, các nhà phân tích tìm tòi tiến hành kiểm tra thông qua phân tích động. Để phân tích kiểm tra phần mềm độc hại hầu hết dựa vào việc sử dụng các máy ảo để đảm bảo chức năng và sự an toàn. Có sự khác biệt nhỏ trong hoạt động giữa máy ảo và máy vật lý. Phần mềm độc hại hiện nay kiểm tra những khác biệt này và thay đổi hành vi của nó khi nó phát hiện thấy sự hiện diện của máy ảo, hành vi trốn tránh mã độc chủ yếu quan tâm đến phát hiện máy ảo và trốn tránh không thực thi. Các kỹ thuật chống máy ảo này của phần mềm độc hại cản trở việc phân tích. Trong luận văn này, chúng tôi chống lại các kỹ thuật phát hiện máy ảo, bằng cách phân tích mã độc thông qua 6 mô đun, tùy biến các máy ảo để chúng giống như máy thật. Ngoài ra chúng tôi tạo bộ dữ liệu thử nghiệm gồm 205 mẫu thử. Kết quả của luận văn có thể được sử dụng cho việc phân tích động hiệu quả hơn.

Trân trọng.

Sử dụng GIS đánh giá các yếu tố về Kinh tế, Xã hội, Môi trường và Điều kiện tự nhiên ảnh hưởng đến cây Hồ tiêu tại Đắk Lắk

on .

Trong những năm vừa qua, tình trạng nông sản rơi vào cảnh được mùa, mất giá, cần phải giải cứu đang diễn ra tràn lan. Đó là hệ lụy của việc sản xuất theo cảm tính, phá vỡ quy hoạch khiến cung vượt quá nhu cầu. Theo xu hướng phát triển của nền nông nghiệp hiện đại, cần phải áp dụng các tiến bộ khoa học kỹ thuật để xây dựng những vùng sản xuất quy mô lớn, từ đó giảm chi phí sản xuất, có sản phẩm chất lượng tốt và đảm bảo số lượng theo yêu cầu của thị trường … Nhận thấy được nhu cầu đó, nghiên cứu đề xuất sử dụng GIS đánh giá các yếu tố về Kinh tế, Xã hội, Môi trường và Điều kiện tự nhiên để tìm ra cây trồng phù hợp cho từng vùng. Các nghiên cứu trước đây chủ yếu đề cập đến hai yếu tố là Điều kiện tự nhiên và Kinh tế, tuy nhiên, những năm gần đây, nhiều nghiên cứu đã chứng minh các yếu tố Xã hội và Môi trường cũng ảnh hưởng đến việc quy hoạch đất trồng cây với xu hướng phát triển bền vững. Nghiên cứu cũng tiến hành thực nghiệm trên cây Hồ Tiêu tại Đắk Lắk bởi theo số liệu từ Bộ Nông nghiệp và Phát triển nông thôn, xuất khẩu hồ tiêu của Việt Nam đang đứng đầu thế giới nhưng đang gặp phải nhiều thách thức khi người dân đổ xô trồng hồ tiêu hàng loạt, không có quy hoạch, đặt biệt tại tỉnh Đắk Lắk nơi có sản lượng hồ tiêu lớn nhất cả nước. Kết quả của quá trình thực nghiệm là bản đồ phân loại thích nghi của cây hồ tiêu tại tỉnh Đắk Lắk được xây dựng bằng công nghệ GIS, áp dụng thuật toán nội suy (IDW) và phương pháp chồng lớp, phân tích đa tiêu chuẩn (MCA), kết hợp các tiêu chí từ FAO.

 

Nhóm thực hiện: 

Lê Bá Thiền, Trần Đức Thuận

 

Xem bài chi tiết tại đây.