Sáng kiến kinh nghiệm Phương pháp sử dụng Công nghệ thông tin để dự đoán kết quả thi Tốt nghiệp/THPT cho học sinh tại trường THPT Tây Hiếu – THPT 1/5

Nội dung nghiên cứu

- Thu thập dữ liệu về học sinh Trường THPT Tây Hiếu, thị xã Thái Hòa, tỉnh

Nghệ An và trường THPT 1/5 huyện Nghĩa Đàn ;

- Nghiên cứu lý thuyết về khai phá dữ liệu, cụ thể là các giải thuật khai phá

luật phân lớp và phân cụm;

- Tìm hiểu các công trình nghiên cứu liên quan đến đề tài;

- Ứng dụng các kỹ thuật khai phá dữ liệu trên tập dữ liệu đã thu thập;

- Sử dụng ngôn ngữ lập trình Python và một số công cụ khai phá dữ liệu để

tiến hành thực nghiệm;

- Nhận xét, đánh giá và phân tích những kết quả thu được từ tập dữ liệu.

pdf33 trang | Chia sẻ: thuydung3ka2 | Ngày: 04/03/2022 | Lượt xem: 853 | Lượt tải: 0Download
Bạn đang xem 20 trang mẫu của tài liệu "Sáng kiến kinh nghiệm Phương pháp sử dụng Công nghệ thông tin để dự đoán kết quả thi Tốt nghiệp/THPT cho học sinh tại trường THPT Tây Hiếu – THPT 1/5", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
 không cần thiết, nói chung 
nên xóa bỏ các dữ liệu không đúng đắn. 
+ Tích hợp dữ liệu (Data integration): Chúng ta cần tổng hợp, Kết hợp dữ 
liệu từ nhiều nguồn dữ liệu khác nhau. 
+ Lựa chọn dữ liệu (Data selection): Đây là giai đoạn quan trọng ta cần chọn 
lọc, trích rút các dữ liệu cần thiết của ài toán và phù hợp cho quá trình phân tích từ 
cơ sở dữ liệu. 
+ Chuyển dạng dữ liệu (Data transformation): Đây là bước chuẩn hóa đòi hỏi 
phải lựa chọn phương pháp thích hợp và làm mịn dữ liệu để đưa dữ liệu về dạng 
thuận lợi nhất cho quá trình khai phá dữ liệu từ tập dữ liệu của bài toán. 
19 
- Bước thứ ba: Khai phá dữ liệu (Data mining). 
Bước này là khai phá dữ liệu, hay nói cách khác là trích ra các mẫu hoặc/và 
các mô hình ẩn dưới các dữ liệu. Ở bước này rất là quan trọng, nó bao gồm các 
công đoạn như: 
+ Xác định chức năng, nhiệm vụ và mục đích của khai phá dữ liệu? 
+ Dùng phương pháp khai phá nào? 
Thông thường với các bài toán khai phá dữ liệu bao gồm: 
+ Các bài toán mang tính mô tả - đưa ra tính chất chung nhất của dữ liệu; 
+ Các bài toán về dự báo và bao gồm cả việc phát hiện các suy diễn dựa trên 
tập dữ liệu đã có. 
Ở bước này tuỳ theo bài toán mà ta xác định được và lựa chọn các phương 
pháp khai phá dữ liệu cho phù hợp. 
- Bước thứ tư: Đánh giá mẫu (Pattern evaluation): Dựa trên tập dữ liệu, các 
độ đo đặc trưng, xác định các mẫu thực sự đáng quan tâm để biểu diễn. 
- Bước thứ năm: Biểu diễn các kết quả của quá trình, phát hiện và đưa ra các 
dự báo và có thể ứng dụng trong các cấp học khác tương đồng. 
Do các kết quả trên có thể là các dự đoán hoặc các mô tả mang tính khoa học 
nên chúng có thể làm căn cứ để tư vấn, cảnh báo, nhắc nhở các em học sinh và 
cũng giúp các nhà quản lý giáo dục có cái nhìn khách quan từ đó có thể điều chỉnh 
kế hoạch dạy học phù hợp với đối tượng học sinh giúp học sinh đạt kết quả cao 
trong kỳ thi THPT quốc gia sắp tới. 
2.2. Áp dụng kỹ thuật phân lớp 
Kĩ thuật phân lớp dữ liệu trong Khai Phá Dữ Liệu là một trong những vấn đề 
nguyên cứu mở rộng hiện nay; tập trung chủ yếu vào thống kê, máy học và mạng 
nơtrôn . 
Kĩ thuật phân lớp được đánh giá là một kĩ thuật khai phá dữ liệu được sử 
dụng rộng rãi nhất với nhiều mở rộng. Sự kết hợp của kỹ thuật phân lớp và cơ sở 
20 
dữ liệu là một lĩnh vực hứa hẹn bởi vì đáp ứng được một vấn đề hết sức quan trọng 
của ứng dụng cơ sở dữ liệu đó là tính uyển chuyển cao. Với những ý nghĩa và vai 
trò hết sức quan trọng của kĩ thuật phân lớp đã nêu ở trên, thuật phân lớp trong thời 
gian gẩn đây từ những kết quả được đăng tải trên một số báo cáo khoa học tại 
những hội nghị khoa học quốc tế về Khai Phá Dữ Liệu cũng như việc tìm hiểu và 
sử dụng kĩ thuật phân lớp. 
Giới thiệu về phân lớp: Phân lớp dữ liệu là kĩ thuật dựa trên tập huấn luyện và 
những giá trị hay hay là nhãn của lớp trong một thuộc tính phân lớp và sử dụng nó 
trong việc phân lớp dữ liệu mới. Phân lớp cũng là tiên đoán loại lớp của nhãn. Bên 
cạnh kĩ thuật phân lớp có một hình thức tương tự là kĩ thuật tiên đoán, kĩ thuật. 
Kĩ thuật phân lớp được tiến hành bao gồm 2 bước : Xây dựng mô hình và sử 
dụng mô hình. 
- Xây dựng mô hình: Là mô tả một tập những lớp được định nghĩa trước trong 
đó: mỗi bộ hoặc mẫu được gán thuộc về một lớp được định nghĩa trước như là 
được xát định bởi thuộc tính nhãn lớp, tập hợp của những bộ được sử dụng trong 
việc sử dụng mô hình được gọi là tập huấn luyện. Mô hình được biểu diễn là 
những luật phân lớp, cây quyết định và những công thức toán học. 
- Sử dụng mô hình: Việc sử dụng mô hình phục vụ cho mục đích phân lớp dữ 
liệu trong tương lai hoặc phân lớp cho những đối tượng chưa biết đến. Trước khi 
sử dụng mô hình người ta thường phải đánh giá tính chính xác của mô hình trong 
đó : nhãn được biết của mẫu kiểm tra được so sánh với kết quả phân lớp của mô 
hình, độ chính xác là phần trăm của tập hợp mẫu kiểm tra mà phân loại đúng bởi 
mô hình, tập kiểm tra là độc lập với tập huấn luyện. Phân lớp là một hình thức học 
được giám sát tức là: tập dữ liệu huấn luyện ( quan sát, thẩm định ) đi đôi với 
những nhãn chỉ định lớp quan sát, những dữ liệu mới được phân lớp dựa trên tập 
huấn luyện. Ngược lại với hình thức học được giám sát là hình thức học không 
được giám sát lúc đó nhãn lớp của tập dữ liệu huấn luyện là không được biết đến . 
21 
Đây là một trong những bài toán phổ biến nhất của khai phá dữ liệu với mục 
tiêu tìm ra mối quan hệ giữa thuộc tính dự báo và thuộc tính phân lớp. Chính vì 
điều đó, quá trình phân lớp có thể sử dụng mối quan hệ này để dự báo cho các 
mẫu mới. Phân lớp dữ liệu có vai trò quan trọng trong tiến trình dự báo các 
khuynh hướng, quy luật phát triển. 
Cho tập dữ liệu chứa các đối tượng bao gồm các thuộc tính mô tả cùng với 
một thuộc tính lớp của đối tượng đó, thuật toán cây quyết định sẽ tạo ra các luật để 
dự đoán lớp của các đối tượng chưa biết. 
Dữ liệu thu thập được thông qua thuật toán phân lớp sẽ tạo ra được mô hình, 
từ mô hình này sẽ dùng bộ dữ liệu để kiểm tra độ chính xác và dùng để dự đoán 
các bộ dữ liệu chưa được gán nhãn. 
 2.3. Áp dụng kỹ thuật phân cụm 
Phân cụm dữ liệu là kỹ thuật rất quan trọng trong khai phá dữ liệu. Có rất 
nhiều định nghĩa khác nhau về kỹ thuật này, về bản chất có thể hiểu phân cụm là 
các quy trình tìm cách nhóm các đối tượng đã cho vào các cụm (clusters), sao cho 
các đối tượng trong cùng một cụm tương tự nhau và các đối tượng khác cụm thì 
không tương tự nhau. Mục đích của phân cụm là tìm ra bản chất bên trong các 
nhóm của dữ liệu. Tuy nhiên, không có tiêu chí nào được xem là tốt nhất để đánh 
giá hiệu quả của phân tích phân cụm, điều này phụ thuộc vào mục đích của phân 
cụm như: giảm dữ liệu (data reduction), “cụm tự nhiên” (“natural clusters”), cụm 
“có ích” (“useful” clusters), phát hiện phần tử ngoại lai (outlier detection). 
Mục tiêu chính của phương pháp này là nhóm các đối tượng tương tự nhau 
trong tập dữ liệu vào các cụm sao cho các đối tượng thuộc cùng một cụm là tương 
đồng còn các đối tượng thuộc các cụm khác nhau sẽ không tương đồng. Phân cụm 
dữ liệu là một ví dụ của phương pháp học không giám sát. Không giống như phân 
loại dữ liệu, phân cụm dữ liệu không đòi hỏi phải định nghĩa trước các mẫu dữ 
liệu huấn luyện. Vì thế, có thể coi phân cụm dữ liệu là một cách học bằng quan sát 
(learning by observation), trong khi phân lớp dữ liệu là học bằng ví dụ (learning 
22 
by example). Phân cụm dữ liệu được sử dụng nhiều trong các ứng dụng về phân 
đoạn thị trường, phân đoạn khách hàng, nhận dạng mẫu, 
3. Thực nghiệm 
Đây là kết quả của việc khai phá dữ liệu dựa vào các kỹ thuật phân lớp, phân 
cụm trên tập dữ liệu về 1198 học sinh ở trường THPT Tây Hiếu và THPT 1/5, 
trong đó 1198 học sinh trong những năm học 2017 - 2018, 2018 - 2019, 2019 – 
2020 dùng để huấn luyện và 599 học sinh của năm học 2020-2021 dùng để dự 
đoán, dự báo. 
3.1. Môi trường thực nghiệm 
Hiện nay có nhiều công cụ lập trình như: C, C++, Pascal, C# hay Python 
Trong số đó, Python là ngôn ngữ lập trình được sử dụng phổ biến vì nhiều tính 
năng đa dạng của ngôn ngữ này. Đây cũng là ngôn ngữ được dùng nhiều trong 
ngành khoa học về dữ liệu (Data science) cũng như là ngôn ngữ phổ biến để xây 
dựng các chương trình liên quan đến học máy, nhận dạng mẫu . 
Python ra đời từ năm 1989, nhưng trong khoảng trên 5 năm trở lại đây, 
Python mới được nhiều người sử dụng và hiện nay cộng đồng người sử dụng ngôn 
ngữ này rất đông, nếu so sánh từ bảng xếp hạng các ngôn ngữ lập trình tháng 6 
năm 2018 thì Python đứng thứ 4 trong 10 ngôn ngữ phổ biến nhất 
[https://www.tiobe.com]. 
Ngôn ngữ lập trình Python có một số điểm nổi bật như sau: 
- Người lập trình dễ học: Ngôn ngữ lập trình Python không có nhiều từ khóa, 
cú pháp đơn giản, rõ ràng nên rất thân thiện với người mới học. 
- Cấu trúc: Ngữ lập trình Python dễ đọc, dễ hiểu và có thể suy đoán được ý 
nghĩa của từng dòng lệnh trong mã lệnh. 
- Chương trình viết bằng ngôn ngữ lập trình Python có thể được chạy trên 
nhiều hệ điều hành khác nhau bao gồm Windows, macOS và Linux. 
23 
- Tính mở cao: Một ưu điểm của Python so với ngôn ngữ lập trình Matlab là 
người dùng có thể tự do sử dụng và phân phối Python. Đây là ngôn ngữ lập trình 
có một cộng đồng rộng lớn, không ngừng cải thiện nó mỗi lần cập nhật. 
- Dễ dàng chỉnh sửa, nâng cấp và nhúng: người lập trình có thể dễ dàng nhúng 
các đoạn chương trình viết bằng các ngôn ngữ khác nhưg C, C++ vào một chương 
trình của Python. Điều này sẽ cung cấp cho ứng dụng đang thực hiện có những tính 
năng tốt hơn mà những ngôn ngữ lập trình khác khó có thể làm được. 
- Ngôn ngữ thông dịch thuận lợi, cấp cao: Không giống như các ngôn ngữ lập 
trình C/C++, khi lập trình với Python, người lập trình không phải lo lắng những 
nhiệm vụ khó khăn như quản lý bộ nhớ, dọn dẹp dữ liệu. 
- Có rất nhiều bộ thư viện giúp tiết kiệm được nhiều thời gian về lập trình: 
Python cung cấp số lượng lớn thư viện giúp cho công việc lập trình trở nên dễ 
dàng hơn và rút ngắn thời gian lập trình. 
- Giúp giai quyết những vấn đề phức tạp, hướng đối tượng: Tương tự như 
ngôn ngữ lập trình C-Sharp, mọi thứ trong Python đều là hướng đối tượng. Lập 
trình hướng đối tượng trong Python giúp giải quyết những vấn đề phức tạp một 
cách trực quan. Ta có thể phân chia những vấn đề phức tạp thành những tập nhỏ 
hơn bằng cách tạo ra các đối tượng. 
Để cài đặt Python, ta cần tải bộ cài tại địa chỉ: 
https://www.python.org/downloads/ 
Hình 3.1. Biểu tượng ngôn ngữ lập trình Python và PyCharm 
Có nhiều môi trường tích hợp để phát triển các ứng dụng Python như 
Sublime, Eclipse IDE, NetBeans, Microsoft Visual Studio, PyCharm, Trong số 
đó JetBrains PyCharm là một trong những môi trường phát triển Python được 
nhiều người dùng. Pycharm dễ dàng phát hiện và sửa lỗi mã, chỉnh sửa và xử lý sự 
24 
cố. Bộ biên tập mã thông minh của PyCharm cung cấp hỗ trợ cho Python, 
Javascript, CSS và nhiều thứ khác. 
 3.2. Các bước thực hiện 
Bước 1: Cài đặt Python (cho hệ điều hành windows): 
- Tải Python cho hệ thống windows : Trình thông dịch Windows Python có 
thể được cài đặt miễn phí từ website của Python 
Hình 3.2 Tải và cài đặt Python cho Hệ điều hành 
- Cài trình thông dịch cho Python: Ta có thể hợp nhất Python vào ứng dụng 
thông dịch dòng lệnh có sẵn trong Windows (Command Prompt) bằng cách bật lựa 
chọn cuối cùng trong danh sách mô-đun sẵn có 
Hình 3.3 Tải và cài đặt Python cho Hệ điều hành 
- Cài đặt chương trình soạn thảo văn bản 
25 
Dù có thể viết chương trình Python với Notepad hay TextEdit, ta sẽ dễ đọc và 
viết mã hơn nhiều khi sử dụng một chương trình soạn thảo văn bản chuyên biệt. Có 
rất nhiều chương trình soạn thảo miễn phí, chẳng hạn Notepad++ (Windows), 
TextWrangler (Mac) hay Jedit (cho bất kỳ hệ điều hành nào). 
Hình 3.4 Tải và cài đặt Python cho Hệ điều hành 
- Kiểm tra cài đặt của bạn. Mở Command Prompt (Windows) hoặc Terminal 
(Trình giả lập - Mac/Linux) và đánh python . Python sẽ tải và hiển thị số phiên 
bản. Bạn sẽ được chuyển đến ứng dụng thông dịch dòng lệnh của trình phiên dịch 
Python, được thể hiện dưới dạng: >>>. 
Hình 3.5 Tải và cài đặt Python cho Hệ điều hành 
26 
Bước 2: Lập trình trên Python với: Tập dữ liệu để học và huấn luyện của học 
sinh từ năm 2017, 2018, 2019 
Bước 3: Từ kết quả trên đưa ra dự báo trên tập dữ liệu học sinh năm 2020 
3.3. Kết quả thực nghiệm và phân tích kết quả 
Sau khi thực hiện trên tệp dữ liệu đã mô tả ở trên, mỗi học sinh có 44 thuộc 
tính để đưa vào học máy, huấn luyện và dữ liệu 599 học sinh cần dự báo về điểm 
thi đang học tại trường THPT Tây Hiếu, THPT 1/5 năm 2020-2021 đã cho ta kết 
quả dự báo mang tính khoa học như mong muốn. 
Hình 3.6 Kết quả dự đoán 
27 
Hình 3.7 Kết quả dự đoán 
Phần 3. Kết luận và kiến nghị 
1. Nhận xét: 
Với bài toán nghiên cứu các nhân tố ảnh hưởng đến kết quả thi TN/THPT 
quốc gia của học sinh của trường THPT Tây hiếu và trường THPT 1/5 nói riêng và 
học sinh THPT nói chung là rất cấp thiết. 
Dựa trên ứng dụng của công nghệ thông tin, sự phân tích những yếu tố mang 
tính khoa học này sẽ giúp nhà trường phát huy được những yếu tố quan trọng về 
chuyên môn của một số môn học giúp học sinh tiến bộ vượt bậc qua 3 năm học với 
điểm đầu vào lớp 10 thấp nhưng đã có nhiều tiến bộ qua từng năm học và hạn chế 
được việc học sinh có kết quả đi xuống qua đó góp phần nâng cao chất lượng giảng 
dạy và học tập chung của nhà trường và học sinh, từ đó nâng cao kết quả học tập 
cũng như chất lượng đào tạo của trường để được phụ huynh và học sinh tin tưởng, 
giao phó. 
Để đạt được mục đích nghiên cứu của Đề tài này, tác giả đã khảo sát, tập hợp 
dữ liệu của 1198 học sinh từ năm học 2017-2018 đến năm học 2020-2021 của 
trường THPT Tây Hiếu, THPT 1/5 với mỗi học sinh có 44 thuộc tính như trên. 
28 
Từ kết quả nghiên cứu cho thấy rằng những yếu tố sau ảnh hưởng đến kết quả 
thi TN/THPT quốc gia của học sinh: 
- Vai trò của giáo viên trong hoạt động giảng dạy (bao gồm các thuộc tính 
điểm tuyển sinh vào 10, điểm các môn dự thi THPT quốc gia, điểm tổng kết học 
lực, hạnh kiểm  của 3 khối 10, 11, 12. 
Như vậy để góp phần nâng cao chất lượng giáo dục, nâng cao kết quả kỳ thi 
TN/THPT quốc gia của học sinh thì vai trò của người giáo viên rất là quan trọng, 
nhất là trong giai đoạn đổi mới giáo dục hiện nay. Sự quyết tâm cao, có tinh thần 
trách nhiệm, và sự nhận thức đúng đắn, kỹ năng sử dụng có hiệu quả thiết bị dạy 
học và tổ chức hướng dẫn học sinh học tập tốt là những phẩm chất cần thiết của 
người giáo viên trong nhà trường. Bên cạnh đó điểm quan trọng trong công tác 
giáo dục là tri thức của người giáo viên, người giáo viên phải không ngừng nâng 
cao trình độ chuyên môn nghiệp vụ, luôn học hỏi phát triển kỹ năng tổ chức, 
hướng dẫn giúp đỡ học sinh trong và ngoài nhà trường. 
- Thái độ, ý thức học tập của học sinh 
 Với kết quả dự báo của đề tài giúp học sinh có 1 kênh thông tin dự báo quan 
trọng, mang tính khoa học với các học sinh được học tập tại trường THPT Tây 
Hiếu, THPT 1/5. Qua đó giúp học sinh có kết quả dự báo không cao, phải cố gắng 
nhiều hơn nữa trong khoảng thời gian còn lại chờ đến ngày thi Tn/THPT Quốc gia 
2021. 
Mỗi học sinh phải nhận thức việc học là quan trọng, nhất là trong môi trường 
giáo dục hiện nay với cách dạy của giáo viên và cách học của học sinh tại trường 
THPT Tây Hiếu, THPT 1/5, qua đó tự lập kế hoạch học tập phù hợp để đạt kết quả 
cao trong kỳ thi THPT quốc gia 2021. 
- Với cấp Quản lý của nhà trường từ các tập phân tích, huấn luyện, dự báo của 
đề tài có cái nhìn khách quan về cống tác giảng dạy của tập thể giáo viên và cách 
học của học sinh. Từ đó đưa ra được các quyết sách, kế hoạch hợp lý để nâng cao 
chất lượng dạy học chung và nâng cao kết quả kỳ thi THPT quốc gia nói riêng và 
29 
sử dụng kênh thông tin này để tư vấn, hướng nghiệp cho các em học sinh làm hồ 
sơ đăng ký thi TN/THPT quốc gia và chọn được các trường học, ngành học theo 
đúng năng lực sở trường của học sinh. 
2. Kiến nghị 
- Có kế hoạch thực hiện tốt chương trình tư vấn định hướng nghề nghiệp dựa 
vào ứng dụng của CNTT đặc biệt là việc đưa ra các dự báo mang tính khoa học về 
kết quả thi THPT quốc gia; 
- Quan tâm, đầu tư kinh phí, đặt hàng các đề tài khoa học nghiên cứu về nâng 
cao chất lượng trong các cơ sở giáo dục. 
- Sử dụng kết quả dự báo của đề tài này để làm cơ sở cho việc đánh giá, xếp 
loại, chất lượng giáo viên thông qua kết quả là học sinh 
- Xây dựng kế hoạch tư vấn, hướng nghiệp cho học sinh dựa trên đề tài này 
qua đó giúp học sinh lựa chọn môn thi, khối thi dựa kết quả học tập rèn luyện trong 
các năm học lớp 10,11 và 12. 
- Hỗ trợ thêm nhân lực để cùng tác giả thực hiện có hiệu quả trong công tác 
dự báo, tư vấn học sinh lựa chọn khối thi vào trước mỗi kỳ thi. 
3. Kết quả đạt được 
Từ kết quả nghiên cứu về lý thuyết và thực nghiệm, nhóm tác giả đã thu nhận 
được những góp ý hữu ích về đánh giá học sinh, dự đoán kết quả các môn thi trong 
các kỳ thi thông qua tập hợp các thông tin cá nhân đã có trước đó tại trường THPT. 
Chúng tôi đã chọn và xây dựng đề tài này nhằm đáp ứng được các yêu cầu đặt 
ra là ứng dụng công nghệ thông tin trong công tác dự báo kết quả trong kỳ thi 
TN/THPT quốc gia và tư vấn hướng nghiệp giúp học sinh chọn đúng môn thi theo 
năng lực của học sinh. Tuy nhiên trong đề tài còn bộc lộ một số hạn chế vì chỉ mới 
thực hiện trên tập dữ liệu tại trường THPT Tây hiếu, THPT 1/5. 
Để đề tài nghiên cứu này có thể tiếp tục được nghiên cứu và mở rộng để có 
thể ứng dụng được rộng rãi trong các cập học của nền giáo dục nước nhà, ngoài ra 
đề tài cũng quan tâm và giới thiệu thêm đến người dùng 1 ngôn ngữ mới là Python. 
30 
Đề tài đã thực hiện theo đúng nhiệm vụ được giao và đúng thời hạn theo yêu 
cầu đặt ra. Tuy nhiên với bản thân, đây là một đề tài mang tính mới, được phụ 
huynh và học sinh THPT quan tâm và khó, do đó không thể tránh khỏi những thiếu 
sót, khiếm khuyết. Vì vậy, tôi rất mong được quý Thầy, cô giáo và các đồng 
nghiệp góp ý để tôi hoàn thiện đề tài này. 
4. Hướng phát triển đề tài 
Khi có ý tưởng lựa chọn, nghiên cứu về đề tài này bản thân nhóm chúng tôi 
luôn mong muốn và đặt ra mục tiêu của mình là phải giải quyết được hai nội dung 
cơ bản sau: Thứ nhất là đưa ra dự đoán (dự báo) một cách khoa học về điểm thi 
của mỗi học sinh với tập thông tin cá nhân đã có; Thứ hai là sử dụng kết quả dự 
báo đó để giúp học sinh có thêm một kênh thông tin đáng tin cậy vào công tác 
tuyển sinh chọn môn thi TN/THPT quốc gia và chọn nghành chọn trường  và 
đưa đề tài vào áp dụng cho các trường, các cấp học nói. 
Tôi mong rằng trong các đề tài nghiên cứu tiếp theo sẽ có nhiều đề tài nghiên 
cứu chuyên sâu hơn nữa qua đó có thể là kênh thông tin giúp tư vấn cho học sinh 
lựa chọn các môn thi, loại trường đại học, cao đẳng, hay lựa chọn ngành nghề phù 
hợp với năng lực của bản thân ... Để những đóng góp đó phần nào đem đến nhiều 
thuận lợi cho công tác dạy học cũng như công tác quản lí giáo dục. 
Với thời gian dài nghiên cứu, ấp ủ các ý tưởng và tất cả tâm huyết đối với 
ngành giáo dục, bản thân nhóm chúng tôi luôn luôn nỗ lực, tìm tòi, học hỏi các nội 
dung liên quan. Nhưng do đây là một nội dung mang tính mới, cao, nội dung đa 
dạng, do đó trong quá trình thực hiện nhiệm vụ nghiên cứu, cũng không thể tránh 
khỏi những khiếm khuyết và hạn chế. Chúng tôi rất mong muốn được các thầy 
giáo, cô giáo các bạn bè, đồng nghiệp, đóng góp ý kiến để giúp chúng tôi hoàn 
thiện hướng nghiên cứu trong tương lai để ứng dụng vào thực tiễn ngày càng hiệu 
quả. 
Xin chân thành cảm ơn !. 
31 
DANH MỤC CÁC TỪ VIẾT TẮT 
1. CNTT Công nghệ thông tin 
2. CSDL Cơ sở dữ liệu 
3. CĐ Cao đẳng 
4. ĐH Đại học 
5. GD-ĐT Giáo dục và Đào Tạo 
6. GDTX Giáo dục thường xuyên 
7. KTKĐCLGD Khảo thí kiểm định chất lượng giáo dục 
8. THPT Trung học phổ thông 
9. HN Hướng nghiệp 
32 
MỤC LỤC 
Nội dung Trang 
Phần 1: Đặt vấn đề 1 
1. Sự cần thiết của vấn đề nghiên cứu 1 
2. Mục tiêu nghiên cứu 3 
 2.1. Mục tiêu tổng quát 3 
2.2. Mục tiêu cụ thể 3 
3. Đối tượng và phạm vi nghên cứu 3 
3.1 . Đối tượng nghiên cứu 3 
 3.2. Phạm vi nghiên cứu 3 
4. Nội dung nghiên cứu 4 
Phần II. Nội dung nghiên cứu 4 
1. Khai phá dữ liệu 4 
1.1. Khai phá dữ liệu trong giáo dục 5 
 1.2. Một số kỹ thuật trong khai phá dữ liệu 6 
 1.3. Bài toán dự đoán kết quả kỳ thi TN/THPT quốc gia 10 
 1.4 Thu thập và tiền xử lý dữ liệu 10 
 1.4.1. Tập hợp dữ liệu 10 
 1.4.2. Tiền xử lý dữ liệu 13 
 2. Dự đoán kết quả thi TN/THPT quốc gia bằng kỹ thuật khai phá 
dữ liệu 
14 
 2.1. Các bước thực hiện 17 
2.2 Áp dụng kỹ thuật phân lớp 19 
 2.3 Áp dụng kỹ thuật phân cụm 21 
 3. Thực nghiệm 22 
 3.1. Môi trường thực nghiệm 22 
 3.2. Các bước thực hiện 24 
33 
 3.3. Kết quả thực nghiệm và phân tích kết quả 26 
Phần 3. Kết luận và kiến nghị 27 
1. Nhận xét 27 
2. Kiến nghị 29 
3. Kết quả đạt được 29 
4. Hướng phát triển đề tài 30 

File đính kèm:

  • pdfsang_kien_kinh_nghiem_phuong_phap_su_dung_cong_nghe_thong_ti.pdf
Sáng Kiến Liên Quan