Sáng kiến kinh nghiệm Phương pháp sử dụng Công nghệ thông tin để dự đoán kết quả thi Tốt nghiệp/THPT cho học sinh tại trường THPT Tây Hiếu – THPT 1/5
Nội dung nghiên cứu
- Thu thập dữ liệu về học sinh Trường THPT Tây Hiếu, thị xã Thái Hòa, tỉnh
Nghệ An và trường THPT 1/5 huyện Nghĩa Đàn ;
- Nghiên cứu lý thuyết về khai phá dữ liệu, cụ thể là các giải thuật khai phá
luật phân lớp và phân cụm;
- Tìm hiểu các công trình nghiên cứu liên quan đến đề tài;
- Ứng dụng các kỹ thuật khai phá dữ liệu trên tập dữ liệu đã thu thập;
- Sử dụng ngôn ngữ lập trình Python và một số công cụ khai phá dữ liệu để
tiến hành thực nghiệm;
- Nhận xét, đánh giá và phân tích những kết quả thu được từ tập dữ liệu.
không cần thiết, nói chung nên xóa bỏ các dữ liệu không đúng đắn. + Tích hợp dữ liệu (Data integration): Chúng ta cần tổng hợp, Kết hợp dữ liệu từ nhiều nguồn dữ liệu khác nhau. + Lựa chọn dữ liệu (Data selection): Đây là giai đoạn quan trọng ta cần chọn lọc, trích rút các dữ liệu cần thiết của ài toán và phù hợp cho quá trình phân tích từ cơ sở dữ liệu. + Chuyển dạng dữ liệu (Data transformation): Đây là bước chuẩn hóa đòi hỏi phải lựa chọn phương pháp thích hợp và làm mịn dữ liệu để đưa dữ liệu về dạng thuận lợi nhất cho quá trình khai phá dữ liệu từ tập dữ liệu của bài toán. 19 - Bước thứ ba: Khai phá dữ liệu (Data mining). Bước này là khai phá dữ liệu, hay nói cách khác là trích ra các mẫu hoặc/và các mô hình ẩn dưới các dữ liệu. Ở bước này rất là quan trọng, nó bao gồm các công đoạn như: + Xác định chức năng, nhiệm vụ và mục đích của khai phá dữ liệu? + Dùng phương pháp khai phá nào? Thông thường với các bài toán khai phá dữ liệu bao gồm: + Các bài toán mang tính mô tả - đưa ra tính chất chung nhất của dữ liệu; + Các bài toán về dự báo và bao gồm cả việc phát hiện các suy diễn dựa trên tập dữ liệu đã có. Ở bước này tuỳ theo bài toán mà ta xác định được và lựa chọn các phương pháp khai phá dữ liệu cho phù hợp. - Bước thứ tư: Đánh giá mẫu (Pattern evaluation): Dựa trên tập dữ liệu, các độ đo đặc trưng, xác định các mẫu thực sự đáng quan tâm để biểu diễn. - Bước thứ năm: Biểu diễn các kết quả của quá trình, phát hiện và đưa ra các dự báo và có thể ứng dụng trong các cấp học khác tương đồng. Do các kết quả trên có thể là các dự đoán hoặc các mô tả mang tính khoa học nên chúng có thể làm căn cứ để tư vấn, cảnh báo, nhắc nhở các em học sinh và cũng giúp các nhà quản lý giáo dục có cái nhìn khách quan từ đó có thể điều chỉnh kế hoạch dạy học phù hợp với đối tượng học sinh giúp học sinh đạt kết quả cao trong kỳ thi THPT quốc gia sắp tới. 2.2. Áp dụng kỹ thuật phân lớp Kĩ thuật phân lớp dữ liệu trong Khai Phá Dữ Liệu là một trong những vấn đề nguyên cứu mở rộng hiện nay; tập trung chủ yếu vào thống kê, máy học và mạng nơtrôn . Kĩ thuật phân lớp được đánh giá là một kĩ thuật khai phá dữ liệu được sử dụng rộng rãi nhất với nhiều mở rộng. Sự kết hợp của kỹ thuật phân lớp và cơ sở 20 dữ liệu là một lĩnh vực hứa hẹn bởi vì đáp ứng được một vấn đề hết sức quan trọng của ứng dụng cơ sở dữ liệu đó là tính uyển chuyển cao. Với những ý nghĩa và vai trò hết sức quan trọng của kĩ thuật phân lớp đã nêu ở trên, thuật phân lớp trong thời gian gẩn đây từ những kết quả được đăng tải trên một số báo cáo khoa học tại những hội nghị khoa học quốc tế về Khai Phá Dữ Liệu cũng như việc tìm hiểu và sử dụng kĩ thuật phân lớp. Giới thiệu về phân lớp: Phân lớp dữ liệu là kĩ thuật dựa trên tập huấn luyện và những giá trị hay hay là nhãn của lớp trong một thuộc tính phân lớp và sử dụng nó trong việc phân lớp dữ liệu mới. Phân lớp cũng là tiên đoán loại lớp của nhãn. Bên cạnh kĩ thuật phân lớp có một hình thức tương tự là kĩ thuật tiên đoán, kĩ thuật. Kĩ thuật phân lớp được tiến hành bao gồm 2 bước : Xây dựng mô hình và sử dụng mô hình. - Xây dựng mô hình: Là mô tả một tập những lớp được định nghĩa trước trong đó: mỗi bộ hoặc mẫu được gán thuộc về một lớp được định nghĩa trước như là được xát định bởi thuộc tính nhãn lớp, tập hợp của những bộ được sử dụng trong việc sử dụng mô hình được gọi là tập huấn luyện. Mô hình được biểu diễn là những luật phân lớp, cây quyết định và những công thức toán học. - Sử dụng mô hình: Việc sử dụng mô hình phục vụ cho mục đích phân lớp dữ liệu trong tương lai hoặc phân lớp cho những đối tượng chưa biết đến. Trước khi sử dụng mô hình người ta thường phải đánh giá tính chính xác của mô hình trong đó : nhãn được biết của mẫu kiểm tra được so sánh với kết quả phân lớp của mô hình, độ chính xác là phần trăm của tập hợp mẫu kiểm tra mà phân loại đúng bởi mô hình, tập kiểm tra là độc lập với tập huấn luyện. Phân lớp là một hình thức học được giám sát tức là: tập dữ liệu huấn luyện ( quan sát, thẩm định ) đi đôi với những nhãn chỉ định lớp quan sát, những dữ liệu mới được phân lớp dựa trên tập huấn luyện. Ngược lại với hình thức học được giám sát là hình thức học không được giám sát lúc đó nhãn lớp của tập dữ liệu huấn luyện là không được biết đến . 21 Đây là một trong những bài toán phổ biến nhất của khai phá dữ liệu với mục tiêu tìm ra mối quan hệ giữa thuộc tính dự báo và thuộc tính phân lớp. Chính vì điều đó, quá trình phân lớp có thể sử dụng mối quan hệ này để dự báo cho các mẫu mới. Phân lớp dữ liệu có vai trò quan trọng trong tiến trình dự báo các khuynh hướng, quy luật phát triển. Cho tập dữ liệu chứa các đối tượng bao gồm các thuộc tính mô tả cùng với một thuộc tính lớp của đối tượng đó, thuật toán cây quyết định sẽ tạo ra các luật để dự đoán lớp của các đối tượng chưa biết. Dữ liệu thu thập được thông qua thuật toán phân lớp sẽ tạo ra được mô hình, từ mô hình này sẽ dùng bộ dữ liệu để kiểm tra độ chính xác và dùng để dự đoán các bộ dữ liệu chưa được gán nhãn. 2.3. Áp dụng kỹ thuật phân cụm Phân cụm dữ liệu là kỹ thuật rất quan trọng trong khai phá dữ liệu. Có rất nhiều định nghĩa khác nhau về kỹ thuật này, về bản chất có thể hiểu phân cụm là các quy trình tìm cách nhóm các đối tượng đã cho vào các cụm (clusters), sao cho các đối tượng trong cùng một cụm tương tự nhau và các đối tượng khác cụm thì không tương tự nhau. Mục đích của phân cụm là tìm ra bản chất bên trong các nhóm của dữ liệu. Tuy nhiên, không có tiêu chí nào được xem là tốt nhất để đánh giá hiệu quả của phân tích phân cụm, điều này phụ thuộc vào mục đích của phân cụm như: giảm dữ liệu (data reduction), “cụm tự nhiên” (“natural clusters”), cụm “có ích” (“useful” clusters), phát hiện phần tử ngoại lai (outlier detection). Mục tiêu chính của phương pháp này là nhóm các đối tượng tương tự nhau trong tập dữ liệu vào các cụm sao cho các đối tượng thuộc cùng một cụm là tương đồng còn các đối tượng thuộc các cụm khác nhau sẽ không tương đồng. Phân cụm dữ liệu là một ví dụ của phương pháp học không giám sát. Không giống như phân loại dữ liệu, phân cụm dữ liệu không đòi hỏi phải định nghĩa trước các mẫu dữ liệu huấn luyện. Vì thế, có thể coi phân cụm dữ liệu là một cách học bằng quan sát (learning by observation), trong khi phân lớp dữ liệu là học bằng ví dụ (learning 22 by example). Phân cụm dữ liệu được sử dụng nhiều trong các ứng dụng về phân đoạn thị trường, phân đoạn khách hàng, nhận dạng mẫu, 3. Thực nghiệm Đây là kết quả của việc khai phá dữ liệu dựa vào các kỹ thuật phân lớp, phân cụm trên tập dữ liệu về 1198 học sinh ở trường THPT Tây Hiếu và THPT 1/5, trong đó 1198 học sinh trong những năm học 2017 - 2018, 2018 - 2019, 2019 – 2020 dùng để huấn luyện và 599 học sinh của năm học 2020-2021 dùng để dự đoán, dự báo. 3.1. Môi trường thực nghiệm Hiện nay có nhiều công cụ lập trình như: C, C++, Pascal, C# hay Python Trong số đó, Python là ngôn ngữ lập trình được sử dụng phổ biến vì nhiều tính năng đa dạng của ngôn ngữ này. Đây cũng là ngôn ngữ được dùng nhiều trong ngành khoa học về dữ liệu (Data science) cũng như là ngôn ngữ phổ biến để xây dựng các chương trình liên quan đến học máy, nhận dạng mẫu . Python ra đời từ năm 1989, nhưng trong khoảng trên 5 năm trở lại đây, Python mới được nhiều người sử dụng và hiện nay cộng đồng người sử dụng ngôn ngữ này rất đông, nếu so sánh từ bảng xếp hạng các ngôn ngữ lập trình tháng 6 năm 2018 thì Python đứng thứ 4 trong 10 ngôn ngữ phổ biến nhất [https://www.tiobe.com]. Ngôn ngữ lập trình Python có một số điểm nổi bật như sau: - Người lập trình dễ học: Ngôn ngữ lập trình Python không có nhiều từ khóa, cú pháp đơn giản, rõ ràng nên rất thân thiện với người mới học. - Cấu trúc: Ngữ lập trình Python dễ đọc, dễ hiểu và có thể suy đoán được ý nghĩa của từng dòng lệnh trong mã lệnh. - Chương trình viết bằng ngôn ngữ lập trình Python có thể được chạy trên nhiều hệ điều hành khác nhau bao gồm Windows, macOS và Linux. 23 - Tính mở cao: Một ưu điểm của Python so với ngôn ngữ lập trình Matlab là người dùng có thể tự do sử dụng và phân phối Python. Đây là ngôn ngữ lập trình có một cộng đồng rộng lớn, không ngừng cải thiện nó mỗi lần cập nhật. - Dễ dàng chỉnh sửa, nâng cấp và nhúng: người lập trình có thể dễ dàng nhúng các đoạn chương trình viết bằng các ngôn ngữ khác nhưg C, C++ vào một chương trình của Python. Điều này sẽ cung cấp cho ứng dụng đang thực hiện có những tính năng tốt hơn mà những ngôn ngữ lập trình khác khó có thể làm được. - Ngôn ngữ thông dịch thuận lợi, cấp cao: Không giống như các ngôn ngữ lập trình C/C++, khi lập trình với Python, người lập trình không phải lo lắng những nhiệm vụ khó khăn như quản lý bộ nhớ, dọn dẹp dữ liệu. - Có rất nhiều bộ thư viện giúp tiết kiệm được nhiều thời gian về lập trình: Python cung cấp số lượng lớn thư viện giúp cho công việc lập trình trở nên dễ dàng hơn và rút ngắn thời gian lập trình. - Giúp giai quyết những vấn đề phức tạp, hướng đối tượng: Tương tự như ngôn ngữ lập trình C-Sharp, mọi thứ trong Python đều là hướng đối tượng. Lập trình hướng đối tượng trong Python giúp giải quyết những vấn đề phức tạp một cách trực quan. Ta có thể phân chia những vấn đề phức tạp thành những tập nhỏ hơn bằng cách tạo ra các đối tượng. Để cài đặt Python, ta cần tải bộ cài tại địa chỉ: https://www.python.org/downloads/ Hình 3.1. Biểu tượng ngôn ngữ lập trình Python và PyCharm Có nhiều môi trường tích hợp để phát triển các ứng dụng Python như Sublime, Eclipse IDE, NetBeans, Microsoft Visual Studio, PyCharm, Trong số đó JetBrains PyCharm là một trong những môi trường phát triển Python được nhiều người dùng. Pycharm dễ dàng phát hiện và sửa lỗi mã, chỉnh sửa và xử lý sự 24 cố. Bộ biên tập mã thông minh của PyCharm cung cấp hỗ trợ cho Python, Javascript, CSS và nhiều thứ khác. 3.2. Các bước thực hiện Bước 1: Cài đặt Python (cho hệ điều hành windows): - Tải Python cho hệ thống windows : Trình thông dịch Windows Python có thể được cài đặt miễn phí từ website của Python Hình 3.2 Tải và cài đặt Python cho Hệ điều hành - Cài trình thông dịch cho Python: Ta có thể hợp nhất Python vào ứng dụng thông dịch dòng lệnh có sẵn trong Windows (Command Prompt) bằng cách bật lựa chọn cuối cùng trong danh sách mô-đun sẵn có Hình 3.3 Tải và cài đặt Python cho Hệ điều hành - Cài đặt chương trình soạn thảo văn bản 25 Dù có thể viết chương trình Python với Notepad hay TextEdit, ta sẽ dễ đọc và viết mã hơn nhiều khi sử dụng một chương trình soạn thảo văn bản chuyên biệt. Có rất nhiều chương trình soạn thảo miễn phí, chẳng hạn Notepad++ (Windows), TextWrangler (Mac) hay Jedit (cho bất kỳ hệ điều hành nào). Hình 3.4 Tải và cài đặt Python cho Hệ điều hành - Kiểm tra cài đặt của bạn. Mở Command Prompt (Windows) hoặc Terminal (Trình giả lập - Mac/Linux) và đánh python . Python sẽ tải và hiển thị số phiên bản. Bạn sẽ được chuyển đến ứng dụng thông dịch dòng lệnh của trình phiên dịch Python, được thể hiện dưới dạng: >>>. Hình 3.5 Tải và cài đặt Python cho Hệ điều hành 26 Bước 2: Lập trình trên Python với: Tập dữ liệu để học và huấn luyện của học sinh từ năm 2017, 2018, 2019 Bước 3: Từ kết quả trên đưa ra dự báo trên tập dữ liệu học sinh năm 2020 3.3. Kết quả thực nghiệm và phân tích kết quả Sau khi thực hiện trên tệp dữ liệu đã mô tả ở trên, mỗi học sinh có 44 thuộc tính để đưa vào học máy, huấn luyện và dữ liệu 599 học sinh cần dự báo về điểm thi đang học tại trường THPT Tây Hiếu, THPT 1/5 năm 2020-2021 đã cho ta kết quả dự báo mang tính khoa học như mong muốn. Hình 3.6 Kết quả dự đoán 27 Hình 3.7 Kết quả dự đoán Phần 3. Kết luận và kiến nghị 1. Nhận xét: Với bài toán nghiên cứu các nhân tố ảnh hưởng đến kết quả thi TN/THPT quốc gia của học sinh của trường THPT Tây hiếu và trường THPT 1/5 nói riêng và học sinh THPT nói chung là rất cấp thiết. Dựa trên ứng dụng của công nghệ thông tin, sự phân tích những yếu tố mang tính khoa học này sẽ giúp nhà trường phát huy được những yếu tố quan trọng về chuyên môn của một số môn học giúp học sinh tiến bộ vượt bậc qua 3 năm học với điểm đầu vào lớp 10 thấp nhưng đã có nhiều tiến bộ qua từng năm học và hạn chế được việc học sinh có kết quả đi xuống qua đó góp phần nâng cao chất lượng giảng dạy và học tập chung của nhà trường và học sinh, từ đó nâng cao kết quả học tập cũng như chất lượng đào tạo của trường để được phụ huynh và học sinh tin tưởng, giao phó. Để đạt được mục đích nghiên cứu của Đề tài này, tác giả đã khảo sát, tập hợp dữ liệu của 1198 học sinh từ năm học 2017-2018 đến năm học 2020-2021 của trường THPT Tây Hiếu, THPT 1/5 với mỗi học sinh có 44 thuộc tính như trên. 28 Từ kết quả nghiên cứu cho thấy rằng những yếu tố sau ảnh hưởng đến kết quả thi TN/THPT quốc gia của học sinh: - Vai trò của giáo viên trong hoạt động giảng dạy (bao gồm các thuộc tính điểm tuyển sinh vào 10, điểm các môn dự thi THPT quốc gia, điểm tổng kết học lực, hạnh kiểm của 3 khối 10, 11, 12. Như vậy để góp phần nâng cao chất lượng giáo dục, nâng cao kết quả kỳ thi TN/THPT quốc gia của học sinh thì vai trò của người giáo viên rất là quan trọng, nhất là trong giai đoạn đổi mới giáo dục hiện nay. Sự quyết tâm cao, có tinh thần trách nhiệm, và sự nhận thức đúng đắn, kỹ năng sử dụng có hiệu quả thiết bị dạy học và tổ chức hướng dẫn học sinh học tập tốt là những phẩm chất cần thiết của người giáo viên trong nhà trường. Bên cạnh đó điểm quan trọng trong công tác giáo dục là tri thức của người giáo viên, người giáo viên phải không ngừng nâng cao trình độ chuyên môn nghiệp vụ, luôn học hỏi phát triển kỹ năng tổ chức, hướng dẫn giúp đỡ học sinh trong và ngoài nhà trường. - Thái độ, ý thức học tập của học sinh Với kết quả dự báo của đề tài giúp học sinh có 1 kênh thông tin dự báo quan trọng, mang tính khoa học với các học sinh được học tập tại trường THPT Tây Hiếu, THPT 1/5. Qua đó giúp học sinh có kết quả dự báo không cao, phải cố gắng nhiều hơn nữa trong khoảng thời gian còn lại chờ đến ngày thi Tn/THPT Quốc gia 2021. Mỗi học sinh phải nhận thức việc học là quan trọng, nhất là trong môi trường giáo dục hiện nay với cách dạy của giáo viên và cách học của học sinh tại trường THPT Tây Hiếu, THPT 1/5, qua đó tự lập kế hoạch học tập phù hợp để đạt kết quả cao trong kỳ thi THPT quốc gia 2021. - Với cấp Quản lý của nhà trường từ các tập phân tích, huấn luyện, dự báo của đề tài có cái nhìn khách quan về cống tác giảng dạy của tập thể giáo viên và cách học của học sinh. Từ đó đưa ra được các quyết sách, kế hoạch hợp lý để nâng cao chất lượng dạy học chung và nâng cao kết quả kỳ thi THPT quốc gia nói riêng và 29 sử dụng kênh thông tin này để tư vấn, hướng nghiệp cho các em học sinh làm hồ sơ đăng ký thi TN/THPT quốc gia và chọn được các trường học, ngành học theo đúng năng lực sở trường của học sinh. 2. Kiến nghị - Có kế hoạch thực hiện tốt chương trình tư vấn định hướng nghề nghiệp dựa vào ứng dụng của CNTT đặc biệt là việc đưa ra các dự báo mang tính khoa học về kết quả thi THPT quốc gia; - Quan tâm, đầu tư kinh phí, đặt hàng các đề tài khoa học nghiên cứu về nâng cao chất lượng trong các cơ sở giáo dục. - Sử dụng kết quả dự báo của đề tài này để làm cơ sở cho việc đánh giá, xếp loại, chất lượng giáo viên thông qua kết quả là học sinh - Xây dựng kế hoạch tư vấn, hướng nghiệp cho học sinh dựa trên đề tài này qua đó giúp học sinh lựa chọn môn thi, khối thi dựa kết quả học tập rèn luyện trong các năm học lớp 10,11 và 12. - Hỗ trợ thêm nhân lực để cùng tác giả thực hiện có hiệu quả trong công tác dự báo, tư vấn học sinh lựa chọn khối thi vào trước mỗi kỳ thi. 3. Kết quả đạt được Từ kết quả nghiên cứu về lý thuyết và thực nghiệm, nhóm tác giả đã thu nhận được những góp ý hữu ích về đánh giá học sinh, dự đoán kết quả các môn thi trong các kỳ thi thông qua tập hợp các thông tin cá nhân đã có trước đó tại trường THPT. Chúng tôi đã chọn và xây dựng đề tài này nhằm đáp ứng được các yêu cầu đặt ra là ứng dụng công nghệ thông tin trong công tác dự báo kết quả trong kỳ thi TN/THPT quốc gia và tư vấn hướng nghiệp giúp học sinh chọn đúng môn thi theo năng lực của học sinh. Tuy nhiên trong đề tài còn bộc lộ một số hạn chế vì chỉ mới thực hiện trên tập dữ liệu tại trường THPT Tây hiếu, THPT 1/5. Để đề tài nghiên cứu này có thể tiếp tục được nghiên cứu và mở rộng để có thể ứng dụng được rộng rãi trong các cập học của nền giáo dục nước nhà, ngoài ra đề tài cũng quan tâm và giới thiệu thêm đến người dùng 1 ngôn ngữ mới là Python. 30 Đề tài đã thực hiện theo đúng nhiệm vụ được giao và đúng thời hạn theo yêu cầu đặt ra. Tuy nhiên với bản thân, đây là một đề tài mang tính mới, được phụ huynh và học sinh THPT quan tâm và khó, do đó không thể tránh khỏi những thiếu sót, khiếm khuyết. Vì vậy, tôi rất mong được quý Thầy, cô giáo và các đồng nghiệp góp ý để tôi hoàn thiện đề tài này. 4. Hướng phát triển đề tài Khi có ý tưởng lựa chọn, nghiên cứu về đề tài này bản thân nhóm chúng tôi luôn mong muốn và đặt ra mục tiêu của mình là phải giải quyết được hai nội dung cơ bản sau: Thứ nhất là đưa ra dự đoán (dự báo) một cách khoa học về điểm thi của mỗi học sinh với tập thông tin cá nhân đã có; Thứ hai là sử dụng kết quả dự báo đó để giúp học sinh có thêm một kênh thông tin đáng tin cậy vào công tác tuyển sinh chọn môn thi TN/THPT quốc gia và chọn nghành chọn trường và đưa đề tài vào áp dụng cho các trường, các cấp học nói. Tôi mong rằng trong các đề tài nghiên cứu tiếp theo sẽ có nhiều đề tài nghiên cứu chuyên sâu hơn nữa qua đó có thể là kênh thông tin giúp tư vấn cho học sinh lựa chọn các môn thi, loại trường đại học, cao đẳng, hay lựa chọn ngành nghề phù hợp với năng lực của bản thân ... Để những đóng góp đó phần nào đem đến nhiều thuận lợi cho công tác dạy học cũng như công tác quản lí giáo dục. Với thời gian dài nghiên cứu, ấp ủ các ý tưởng và tất cả tâm huyết đối với ngành giáo dục, bản thân nhóm chúng tôi luôn luôn nỗ lực, tìm tòi, học hỏi các nội dung liên quan. Nhưng do đây là một nội dung mang tính mới, cao, nội dung đa dạng, do đó trong quá trình thực hiện nhiệm vụ nghiên cứu, cũng không thể tránh khỏi những khiếm khuyết và hạn chế. Chúng tôi rất mong muốn được các thầy giáo, cô giáo các bạn bè, đồng nghiệp, đóng góp ý kiến để giúp chúng tôi hoàn thiện hướng nghiên cứu trong tương lai để ứng dụng vào thực tiễn ngày càng hiệu quả. Xin chân thành cảm ơn !. 31 DANH MỤC CÁC TỪ VIẾT TẮT 1. CNTT Công nghệ thông tin 2. CSDL Cơ sở dữ liệu 3. CĐ Cao đẳng 4. ĐH Đại học 5. GD-ĐT Giáo dục và Đào Tạo 6. GDTX Giáo dục thường xuyên 7. KTKĐCLGD Khảo thí kiểm định chất lượng giáo dục 8. THPT Trung học phổ thông 9. HN Hướng nghiệp 32 MỤC LỤC Nội dung Trang Phần 1: Đặt vấn đề 1 1. Sự cần thiết của vấn đề nghiên cứu 1 2. Mục tiêu nghiên cứu 3 2.1. Mục tiêu tổng quát 3 2.2. Mục tiêu cụ thể 3 3. Đối tượng và phạm vi nghên cứu 3 3.1 . Đối tượng nghiên cứu 3 3.2. Phạm vi nghiên cứu 3 4. Nội dung nghiên cứu 4 Phần II. Nội dung nghiên cứu 4 1. Khai phá dữ liệu 4 1.1. Khai phá dữ liệu trong giáo dục 5 1.2. Một số kỹ thuật trong khai phá dữ liệu 6 1.3. Bài toán dự đoán kết quả kỳ thi TN/THPT quốc gia 10 1.4 Thu thập và tiền xử lý dữ liệu 10 1.4.1. Tập hợp dữ liệu 10 1.4.2. Tiền xử lý dữ liệu 13 2. Dự đoán kết quả thi TN/THPT quốc gia bằng kỹ thuật khai phá dữ liệu 14 2.1. Các bước thực hiện 17 2.2 Áp dụng kỹ thuật phân lớp 19 2.3 Áp dụng kỹ thuật phân cụm 21 3. Thực nghiệm 22 3.1. Môi trường thực nghiệm 22 3.2. Các bước thực hiện 24 33 3.3. Kết quả thực nghiệm và phân tích kết quả 26 Phần 3. Kết luận và kiến nghị 27 1. Nhận xét 27 2. Kiến nghị 29 3. Kết quả đạt được 29 4. Hướng phát triển đề tài 30
File đính kèm:
- sang_kien_kinh_nghiem_phuong_phap_su_dung_cong_nghe_thong_ti.pdf