NGÀNH CNTT TUYỂN SINH NHIỀU CHỈ TIÊU NGÀNH CNTT, CNTT VIỆT NHẬT VÀ KHOA HỌC DỮ LIỆU

Góc học tập

PHÂN TÍCH ẢNH HƯỞNG CỦA MỘT SỐ YẾU TỐ ĐẾN GIÁ NHÀ

on .

HUỲNH KHẢI SIẾU – 18520348 TRẦN THỊ MỸ LINH – 18520999 DƯƠNG THỊ HỒNG HẠNH – 18520711 LÊ PHAN THÀNH ĐẠT – 18520570

1. Mở đầu

Giá nhà đất là một chủ đề luôn nhận được sự quan tâm rất lớn của cộng đồng hiện nay, với quy mô và sự gia tăng dân số mỗi năm dẫn đến tình trạng “đất chật người đông”, nhu cầu thu mua nhà vì thế cũng không ngừng tăng lên. Không những thế, nhà đất còn là lĩnh vực kinh doanh, là cơ hội đầu tư mang về nguồn lợi nhuận lớn cho nhiều người.

Vì vậy mà sự biến động của giá nhà đất trở thành vấn đề quan trọng đối với cả người mua lẫn người bán. Đối với người mua thì nên mua ở đâu, mua khi nào thì mới có được mức giá hợp lý hay đối với người bán thì nên bán ra thời điểm nào để có lời cao ? Đây luôn là câu hỏi khó, bởi diễn biến giá nhà đất là không hề đơn giản và phụ thuộc vào rất nhiều yếu tố tác động lên nó.

Từ đó cho thấy việc phân tích sự ảnh hưởng của các yếu tố đến giá nhà đất là rất cần thiết. Dự đoán giá nhà đất là một giải pháp để giải quyết bài toán cho các doanh nghiệp kinh doanh nhà đất và nhiều ngành nghề liên quan. Từ kết quả dự đoán, doanh nghiệp sẽ đưa ra những đề xuất phù hợp cho khách hàng, kịp thời đưa ra các giải pháp, đối phó với những nguy cơ trong tương lai bằng cách cắt giảm chi phí hoặc thay đổi chiến lược phù hợp. Đối với người có nhu cầu mua nhà, họ sẽ dựa vào kết quả dự đoán để xem xét chọn 1 ngôi nhà có giá cả phù hợp thu nhập tài chính cá nhân, đúng với địa điểm mong muốn. Ví dụ: Gần các cửa hàng tiện lợi, gần ga tàu điện, trung tâm thành phố,...

Để phục vụ những nhu cầu và yêu cầu trên, quá trình phân tích đánh giá và đưa ra kết quả dưới đây sẽ phần nào nói lên kết cấu của sự biến động giá nhà đất thông qua bộ dữ liệu sẵn có.

2. Giới thiệu bộ dữ liệu

Bộ dữ liệu gồm thông tin các thuộc tính và giá cả của 414 ngôi nhà được bán trong ngày 01/01/1970 ở thành phố Tân Đài Bắc, Đài Loan. Cụ thể như sau:

-       Tên bộ dữ liệu: Real estate price prediction.

-       Nguồn: https://www.kaggle.com/quantbruce/real-estate-price-prediction

-       Thông tin chi tiết:

Bảng 2.1: Codebook của bộ dữ liệu.

Tên bộ dữ liệu

Real estate price prediction

Chức năng

Bộ dữ liệu được tạo ra nhằm mục đích sử dụng cho phân tích hồi quy, nghiên cứu mô hình hồi quy tuyến tính đơn/ đa biến và xây dựng mô hình dự đoán kết quả giá nhà.

Số dòng

Gồm 414 điểm dữ liệu và 8 thuộc tính.

Số thuộc tính

8 thuộc tính.

Các thuộc tính

No: (int64) Số thứ tự

X1 transaction date: (float64) Ngày giao dịch.

X2 house age: (float64) Tuổi ngôi nhà.

X3 distance to the nearest MRT station: (float64) Khoảng cách đến trạm ga tàu gần nhất.

X4 number of convenience stores: (float64) Số cửa hàng tiện lợi ở gần đó.

X5 latitude: (float64) Vĩ độ của ngôi nhà.

X6 longitude: (float64) Kinh độ của ngôi nhà.

Tác giả

Bruce

Thông tin chi tiết: https://www.kaggle.com/quantbruce

 Xem tiếp bài báo cáo TẠI ĐÂY.

SỐ CA NHIỄM VÀ TỬ VONG Ở CÁC NHÓM TUỔI, GIỚI TÍNH CỦA CÁC QUỐC GIA Ý, TÂY BAN NHA, ĐỨC

on .

I. Mở đầu

 Khi đại dịch Covid-19 bùng phát, các nước Châu Âu đã và đang lây lan nhanh chóng của dịch bệnh, trở thành các ổ dịch lớn trên thế giới. Trong đó lần lượt Ý, Đức, Tây Ban Nha(TBN) là các nước chịu sự ảnh hưởng nặng nề nhất. Với số lượng nhiễm và tử vong đang trong top 10 thế giới [D1].

 Mục đích của việc ghi nhận số ca nhiễm và tử vong theo độ tuổi và giới tính, sẽ cho thấy mức độ nhiễm và tử vong ở các nhóm tuổi và giới tính. Từ đó đưa ra các nhận định về, độ tuổi nào và giới tính nào sẽ có tỷ lệ nhiễm và tử vong cao hơn các nhóm tuổi cũng như giới tính khác.

[BÀI VIẾT HAY - BÀI SỐ 2] BÀI TẬP GIỚI THIỆU NGÀNH CÔNG NGHỆ THÔNG TIN

on .

Bước vào năm thứ nhất của bậc Đại học, sinh viên sẽ được tiếp xúc với các môn học đại cương trước khi chính thức bước vào các môn chuyên ngành ở những năm học kế tiếp. Vậy những môn học đại cương là gì? Lý do tại sao sinh viên được học những môn ở khối kiến thức giáo dục đại cương trước tiên khi học Đại học? Và những môn học nào chiếm vai trò quan trọng trong khối kiến thức giáo dục đại cương mà sinh viên nên quan tâm?...

 

Xem chi tiết tại đây.

Phan Nguyễn Hải Yến - 21521698

SỰ KHÁC NHAU TRONG DỊCH CHUYỂN CỦA CÁC CỘNG ĐỒNG GIỮA ĐẠI DỊCH COVID-19.

on .

Khi đại dịch Covid-19 bùng phát, việc thực hiện giãn cách xã hội được xem là biện pháp hiệu quả nhằm ngăn chặn sự lây lan của bệnh. Biện pháp này được thực hiện hầu hết mọi quốc gia trên thế giới. Tuy nhiên các quốc gia khác nhau sử dụng các biện pháp khác nhau để thực hiện việc giãn cách xã hội. Tại Việt Nam biện pháp được thực thi trong [1.4.2020-15.4.2020].

Nhằm đo đạc và tính toán việc thực hiện giãn cách xã hội này, Google đã thực hiện một cuộc nghiên cứu có tính thống kê tính đến ngày 5.4.2020. Nghiên cứu liên quan sự thay đổi trong dịch chuyển của các cộng đồng so với giai đoạn chưa thực hiện giãn cách xã hội.  Nghiên cứu dựa trên dữ liệu của người dùng đã chọn tham gia và đồng ý để Google thấy được vị trí của thiết bị thông minh. Vì số lượng người tham gia, và vị trí địa lý người tham gia chưa đầy đủ, nên nó chưa đủ để làm đại điện cho một cộng đồng lớn. Tuy nhiên nó cho phép chúng ta có một góc nhìn hữu ích khác liên quan đến các quan chức y tế cộng đồng trong việc sử dụng kết quả nhằm hạn chế sự lây lan của Covid-19.

Dự đoán các điểm sạt lở và bồi lắng trên Đồng bằng Sông Cửu Long bằng các mô hình học máy

on .

Dự đoán các điểm sạt lở và bồi lắng trên Đồng bằng Sông Cửu Long bằng các mô hình học máy

Võ Chơn Chánh (20521122) - Lê Thị Lan Anh (20521067) - Dương Thị Ngọc Anh (20521062)

Đặt vấn đề

Theo định nghĩa của Brunsden và Cruden, sạt lở đất là sự chuyển động dốc xuống của các mảnh vụn, đá hoặc vật liệu đất dưới tác dụng của lực hấp dẫn. Nó xảy ra khi động lực vượt quá lực cản do sự mất ổn định của các sườn đất hoặc đá tự nhiên. Độ dốc tự nhiên sẽ bị mất ổn định bởi các yếu tố tự nhiên và nhân tạo bao gồm sử dụng đất không hợp lý, sự mất trầm tích, lượng mưa lớn và kéo dài, đá bị phong hóa và nứt nẻ mạnh, xói mòn rãnh và bờ sông, động đất, do sự can thiệp của đất đá bề mặt và giải thích về đô thị không có quy hoạch (Woldearegay, 2013; Wubalem và Meten, 2020).

Sạt lở bờ sông là hệ quả của nhiều tác động khác nhau, từ yếu tố địa chất, địa mạo, thủy văn, khí hậu cho đến các yếu tố tác động từ con người. Với tác động của dòng triều, vùng nghiên cứu chịu chi phối bởi chế độ bán nhật triều không đều của biển Đông, biên độ triều lớn khoảng 2÷4 m. Với chế độ triều và biên độ triều như trên nên tốc độ truyền triều rất nhanh, tạo ra vận tốc dòng chảy lớn, đặc biệt tại cửa sông, gây ra xói lở đáy biển.

Ngoài ra, do ảnh hưởng của cấu tạo đường bờ và trầm tích hạt, với cấu tạo đường bờ biển chủ yếu là bùn sét và cát hạt mịn nên dưới tác động của sóng gió sẽ phá vỡ kết cấu bề mặt bờ nếu như thảm thực vật phủ bề mặt không. Do thành phần hạt rất mịn nên phần lớn vật liệu bờ sau khi bị phá vỡ sẽ chuyển thành bùn cát lơ lửng, dễ dàng bị sóng và dòng chảy ven bờ chuyển đi nơi khác. Do vậy, đường bờ biển rất dễ bị tổn thương nếu không có thảm phủ thực vật hoặc rừng ngập mặn bảo vệ.

Sạt lở xảy ra nghiêm trọng ở nhiều nơi trên thế giới. Ở khu vực Đông Nam Á, Đồng bằng Sông Cửu Long của Việt Nam đã và đang xảy ra hiện tượng sạt lở do chịu tác động kép từ biến đổi khí hậu, nước biển dâng; việc khai thác nguồn nước từ thượng nguồn; tác động từ chính sự phát triển nội tại của vùng. Những năm gần đây, tình trạng sạt lở hệ thống sông rạch, xói lở bờ biển đang diễn ra trên hầu hết các tỉnh, thành trong vùng với mức độ ngày càng trầm trọng và phức tạp hơn, gia tăng cả về phạm vi và cường độ.

Mục đích nghiên cứu này sẽ nghiên cứu mức độ sạt lở và bổi lắng quanh khu vực quanh các con sông và ven biển gây ảnh hưởng đến Đồng bằng Sông Cửu Long. Đồng thời tìm ra các yếu tố ảnh hưởng nhờ vào phương pháp định lượng là chủ yếu. Sử dụng các phương pháp định lượng chủ yếu là xoay quanh việc thống kê, tương quan và hồi quy để tìm hiểu các nguyên nhân ảnh hưởng đến sạt lở đất. Các phương pháp này có độ chính xác cao nhờ vào cơ sở toán học giúp xác định yếu tố ảnh hưởng dễ dàng hơn so với việc định tính.

Thông qua việc nghiên cứu này tạo ra mô hình máy học qua việc học tập bằng nhiều phương pháp khác nhau dự đoán các điểm sạc lở để thành lập bản đồ dự đoán sạc lở trong khu vực Đồng bằng Sông Cửu Long. Khu vực chúng tôi nghiên cứu được thể hiện qua Hình 1.

Phương pháp thực hiện

Các đối tượng bản đồ ở dạng vector (vùng, đường điểm) sẽ được trích xuất nhờ vào công cụ trong QGIS, sau đó sẽ được tính toán các khoảng cách và mức độ sạt lở. Sau đó chuẩn hóa các thuộc tính xuất ra định dạng excel để đưa vào phân tích khai phá dữ liệu.

Trong nghiên cứu này chúng tôi sử dụng 2 phương pháp định lượng là thống kê và tương quan kiểm chứng để tìm các yếu tố ảnh hưởng đến các khu vực bị sạt lở. Chia dữ liệu thành 2 phần (8:2), dữ liệu huấn luyện và kiểm tra sẽ lấy theo yếu tố ngẫu nhiên của thống kê.

Bên cạnh đó, các bản đồ ở dạng vector sẽ được raster hóa để dễ dàng cho việc chồng các bản đồ và tính toán trên vector để thành lập bản đồ dự đoán.

Đưa dữ liệu vào huấn luyện và tạo ra mô hình máy học dự đoán được các điểm sạc lỡ và lập được bản đồ dự đoán mức độ sạc lỡ. Phương pháp thực nghiệm như Hình 2.

Kết luận

Trong nghiên cứu này chúng tôi tập trung giải quyết được vấn đề chính là dự đoán lập bản đồ sạt lở và bồi lắng của Đồng Bằng Sông Cửu Long nhờ vào phân tích định lượng. Đồng thời tạo ra được mô hình dự đoán sạc lở với độ chính xác cao 0.89 của mô hình máy học Logistic Regression với 9 thuộc tính và phân loại thành 6 mức độ của sạt lở và bồi lắng.

Giải quyết được các vấn đề tính toán khoảng cách trong tọa độ và thực tế, phân loại thổ nhưỡng và truy xuất thông tin các map. Tuy nhiên vẫn còn hạn chế về dữ liệu sạc lỡ tại khu vực Đồng Bằng Sông Cửu Long vì lượng dữ liệu còn nên việc dự đoán vị trí sạc lỡ còn nhiều sai sót. Trong tương lai chúng tôi sẽ tiếp tục thu thập thêm các điểm sạc lỡ và tăng cường thêm dữ liệu để bản đồ dự đoán chính xác hơn.

Trân trọng.