Giải bài tập Tin học 12 Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu
Khởi động trang 156 Tin học 12: Bảng 1 lưu trữ dữ liệu của học sinh trong lớp 12, hãy cho biết 2 thông tin hữu ích (phân bố điểm thi môn Toán, phân bố điểm thi môn Ngữ văn của học sinh trong lớp) có thể rút ra được từ bảng dữ liệu này.
Lời giải:
Bảng 1 lưu trữ dữ liệu của học sinh trong lớp 12, ta biết được 2 thông tin hữu ích (phân bố điểm thi môn Toán, phân bố điểm thi môn Ngữ văn của học sinh. Ta biết được điểm số của từng học sinh đang ở mức động nào.
Thực hành trang 157 Tin học 12: Phân tích dữ liệu đầu tư vốn nước ngoài trong một thành phố.
Truy cập vào tệp data.csv (do giáo viên cung cấp) nhằm phân tích bộ dữ liệu Dự án đầu tư vốn nước ngoài trong một thành phố. Bộ dữ liệu này bao gồm tổng cộng 12 cột và gần 9500 bản ghi, lưu trữ thông tin của các dự án có vốn đầu tư nước ngoài như: Tên dự án đầu tư; Số chứng nhận đầu tư; Ngày cấp chứng nhận đầu tư; Tên đơn vị cấp phép; Loại hình đầu tư; Mục tiêu dự án; Quy mô dự án; Tổng vốn USD; Tổng vốn VND; Thời gian thực hiện; Tiến độ thực hiện; Các ưu đãi.
Yêu cầu: Em hãy sử dụng phần mềm bảng tính Microsoft Excel (Excel) để nhằm trích xuất thông tin và tri thức hữu ích. Cụ thể như sau:
a) Sử dụng Power Query của Excel, em hãy thực hiện tiền xử lí dữ liệu (làm sạch dữ liệu, xoá cột, tách cột, thêm cột mới vào bộ dữ liệu).
b) Em hãy sử dụng PivotTable của Excel để tổng hợp tổng số dự án đầu tư theo Đơn vị cấp phép.
c) Sử dụng PivotChart của Excel, thực hiện trực quan hoá dữ liệu Đơn vị cấp phép bằng biểu đồ và rút ra các nhận xét.
Lời giải:
a) Thực hiện các bước như sau để tiền xử lí dữ liệu:
1 Để mở tệp dữ liệu trên ta thực hiện như sau:
Khởi động Excel, nháy chọn thẻ Data, chọn Get Data, chọn From File, chọn From Text/CSV. Chọn tệp data.csv do giáo viên cung cấp. Ở hộp thoại xuất hiện, tại mục File Origin chọn Unicode (UTF-8), tại mục Delimiters chọn Comma. Nháy chọn Load để hoàn thành. i muc Delimiters con Commy. Nay Kết quả như Hình 1.
Dùng Power Query của Excel để tiền xử lý dữ liệu và lưu trữ dữ liệu được làm sạch sang 1 bảng tính khác.
Trong tệp Excel hiện tại, nháy chọn thẻ Data, chọn From Table/Range,
Pb Thực hiện xoá cột: tại cửa sổ hiện ra, lần lượt chọn các cột không cần thiết hoặc không có giá trị tìm hiểu ở thời điểm hiện tại (trong trường hợp này ta bỏ cột MucTieuDA và cột CacUuDai), chọn Remove Column. Các cột đã chọn sẽ được loại bỏ.
Dc Tách cột để lấy thông tin hữu dụng: ở cột NgayCNDauTu ta chỉ cần giữ lại dữ liệu ngày (thời gian cụ thể tính theo giờ trong ngày là không cần thiết). Cách để tách cột thực hiện như sau: Chọn cội cần tách, chọn Split, chọn By Delimiter, chọn Space. Cột được chọn sẽ được phân tách thành nhiều cột nhỏ hơn, chọn giữ cột mà em cần và bỏ các cột còn lại. Làm tương tự với cột Tien Do Thuchien.
Od Tạo cột mới: em cần có cái nhìn tổng quát về bộ dữ liệu đang có để xác định cần tạo thêm cột mới hay không. Trong trường hợp này, cột USD cần được chuyển sang đơn vị VND để dễ dàng so sánh. Cách làm như sau: chọn Add Column, chọn Custom Column chọn Insert cột TongVonUSD, Tạo cột mới DTNN_VND bằng cách nhân với tỉ giá giữa VND và USD.
Đc Lưu dữ liệu được làm sạch: Nháy chọn Close Load to, chọn Table, chọn New Worksheet. Dữ liệu làm sạch sẽ được tách ra một trang mới, các thao tác phân tích và trực quan hoá về sau được thực hiện dựa trên bảng này. Kết quả như Hình 2.
b) Bảng tổng hợp dữ liệu là kết quả thống kê trên bộ dữ liệu nhằm trực quan và rút trích các thông tin hữu ích. Sử dụng chức năng PivotTable để tổng hợp và khám phá dữ liệu đạt độ chính xác cao và tốn ít thời gian hơn so với việc dùng các hàm thông thường trực tiếp ngay trên bảng tính. Cụ thể:
1 Chọn thẻ Insert, chọn PivotTable, chọn From Table/Range. Chọn cột của trang tính muốn tổng hợp. Ở đây, ta sẽ để dạng mặc định là toàn bộ bảng.
2 Chọn các cột và giá trị muốn tổng hợp. Vùng Rows là các hàng cần tổng hợp, nói cách khác, Rows sẽ là tiêu chí mà ta muốn nhóm các mẫu thông tin lại với nhau. Ví dụ, muốn tính tổng số dự án đầu tư theo Đơn vị cấp phép, kéo thả cột TenDVCP vào vùng Rows và kéo thả cột TenDuAnDauTu vào vùng Values. Khi đó, kết quả sẽ tương tự như Hình 3.
c) Thực hiện các bước sau để trực quan hoá dữ liệu:
1 Để tạo biểu đồ cho Đơn vị cấp phép, ta chọn vùng dữ liệu từ bảng tổng hợp (Hình 3). Nháy thẻ Insert, chọn PivotChart, chọn biểu đồ “Pie”. Thay đổi tên biểu đồ thành “Đơn vị cấp phép” (Hình 4).
Luyện tập
Luyện tập 1 trang 160 Tin học 12: Dựa trên dữ liệu ở phần Thực hành, em hãy tạo bảng tổng hợp và vẽ các biểu đồ với các cột chứa dữ liệu về Loại hình đầu tư, Tiến độ thực hiện, Chênh lệch đầu tư, Nguồn đầu tư qua các năm, Thời gian thực hiện.
Lời giải:
Tạo bảng tổng hợp và vẽ các biểu đồ với các cột chứa dữ liệu về Loại hình đầu tư, Tiến độ thực hiện, Chênh lệch đầu tư, Nguồn đầu tư qua các năm, Thời gian thực hiện:
Luyện tập 2 trang 160 Tin học 12: Dựa trên các biểu đồ đã vẽ ở Bài tập 1, em hãy tổng hợp các biểu đồ trên thành Bảng tổng hợp trực quan như Hình 6. Từ các biểu đồ, hãy rút ra các nhận xét.
Lời giải:
Tổng hợp các biểu đồ trên thành Bảng tổng hợp trực quan như Hình 6. Từ các biểu đồ, hãy rút ra các nhận xét.
Từ các biểu đồ, hãy rút ra các nhận xét:
– Loại hình đầu tư: Thể hiện rõ các loại hình đầu tư. Trong đó cao nhất là loại hình Đầu tư vốn trong nước là cao nhất, thấp nhấp là loại hình đầu tư Liên doanh.
– Tiến độ thực hiện dự án: có Hình thức đầu tư BT-Vốn trong nước là có tiến độ thực hiện dự an nhanh nhất.
– Chênh lệch đầu tư trong nước và nước ngoài: Có sự chênh lệch lớn.
– Nguồn đầu tư qua các năm: Cao nhất là các năm 2006-2008 và 2014-2026.
– Thời gian thực hiện dự án: Vốn trong nước có thời gian thực hiện dự an dài nhất.
Vận dụng
Vận dụng trang 160 Tin học 12: Em hãp áp dụng các kiến thức đã học để phân tích các bộ dữ liệu khác nhằm trích xuất thông tin và tri thức hữu ích.
Lời giải:
Một số bộ dữ liệu mà em có thể tham khảo:
* Bộ dữ liệu về dự án đầu tư công (do giáo viên cung cấp):
1. Dự án đầu tư công là gì?
Dự án đầu tư công là dự án sử dụng toàn bộ hoặc một phần vốn đầu tư công theo khoản 13 Điều 4 Luật Đầu tư công 2019.
Trong đó, vốn đầu tư công được quy định tại khoản 22 Điều 4 Luật Đầu tư công 2019 bao gồm vốn ngân sách nhà nước; vốn từ nguồn thu hợp pháp của các cơ quan nhà nước, đơn vị sự nghiệp công lập dành để đầu tư theo quy định của pháp luật.
2. Phân loại dự án đầu tư công
Theo Điều 6 Luật Đầu tư công 2019 quy định về phân loại dự án đầu tư công như sau:
Phân loại dự án đầu tư công căn cứ vào tính chất.
Phân loại dự án đầu tư công căn cứ vào mức độ quan trọng và quy mô
* Bộ dữ liệu về cơ sở dữ liệu (do giao viên cung cấp):
– Cơ sở dữ liệu là một bộ sưu tập dữ liệu có hệ thống, được lưu trữ bằng điện tử. Nó có thể chứa bất kỳ loại dữ liệu nào, bao gồm từ, số, hình ảnh, video và tệp. Bạn có thể sử dụng phần mềm được gọi là hệ thống quản lý cơ sở dữ liệu (DBMS) để lưu trữ, truy xuất và chỉnh sửa dữ liệu. Trong các hệ thống máy tính, cơ sở dữ liệu từ cũng có thể tham khảo bất kỳ DBMS, đến hệ thống cơ sở dữ liệu, hoặc một ứng dụng liên kết với cơ sở dữ liệu.
– Bạn có thể phân loại cơ sở dữ liệu theo trường hợp sử dụng, loại dữ liệu và phương pháp lưu trữ dữ liệu. Dưới đây là ba ví dụ về cách phân loại cơ sở dữ liệu:
Theo nội dung, chẳng hạn như văn bản tài liệu, thống kê hoặc đối tượng đa phương tiện
Theo lĩnh vực ứng dụng, chẳng hạn như kế toán, phim ảnh hoặc sản xuất.
Theo khía cạnh kỹ thuật, chẳng hạn như cấu trúc cơ sở dữ liệu hoặc loại giao diện.
Xem thêm cái bài giải bài tập Tin học 12 Chân trời sáng tạo hay, chi tiết khác:
Bài F16: Máy tính, thuật toán và Khoa học dữ liệu
Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu
Bài F18: Kĩ thuật mô phỏng
Bài F19. Sử dụng phần mềm mô phỏng
Bài G1: Nhóm nghề dịch vụ thuộc ngành Công nghệ thông tin
Bài G2: Nhóm nghề quản trị thuộc ngành Công nghệ thông tin