Sáng kiến đột phá trong nhận dạng hình ảnh của Máy học

(khoahocdoisong.vn) - Học sâu là một lĩnh vực thứ cấp rất quan trọng trong Máy học nhằm tạo ra hệ thống trí tuệ nhân tạo, mô phỏng cấu trúc và chức năng của não. Cơ sở những mô hình này là các mạng lưới thần kinh nhân tạo, mô phỏng sự kết nối thần kinh bộ não động vật, thực hiện các chức năng nhận thức như giải quyết vấn đề.

Mạng nơron thần kinh tích chập

Một lĩnh vực có kết quả ấn tượng nhất trong điện toán biến đổi thần kinh là phân tích hình ảnh trực quan. Tương tự như bộ não con người học cách nhận những vật thể, đưa ra dự đoán và tác động lên đối tượng, trí thông minh nhân tạo phải được cung cấp hàng triệu bức ảnh trước khi AI có thể khái quát vật thể, đưa ra những dự đoán có trình độ tốt nhất đối những hình ảnh mà máy chưa từng thấy trước đây.

Nhóm nghiên cứu của GS Cheol Seong Hwang thuộc Khoa Khoa học và Kỹ thuật Vật liệu, Đại học Quốc gia Seoul đang phát triển một phương pháp nhằm tăng tốc quá trình nhận dạng hình ảnh, đưa ra giải pháp kết hợp bộ nhớ điện trở truy cập ngẫu nhiên (ReRAM) hiệu suất cao và cấu trúc mảng pha thanh ngang chéo, là hai trong số các phần cứng được sử dụng phổ biến nhất.

Nhiều người trong chúng ta thường thực hiện phương pháp nghiên cứu hình ảnh đảo ngược nhằm tìm thấy thông tin trên ảnh một vật thể nhất định, xác thực một kết quả tương tự. Dạy các máy tính thực hiện những bài toán đó bằng phương thức nhận biết các vật thể, các nhà khoa học phát triển mạng nơron thần kinh tích chập, thuật ngữ được đặt theo các phép toán “tích hợp”. Sự tích chập đã thực hiện một cuộc cách mạng trong quá trình nhận biết bằng giải pháp các bộ lọc thông tin mà máy học xử lý trước, nhanh và chính xác hơn so với các thuật toán nhận biết thiết kế thủ công.

 Theo GS Hwang nói, trong máy học, nhận dạng hình ảnh là nhiệm vụ đầu tiên, thường được thực hiện bằng phương pháp tạo ra một mạng lưới thần kinh. Mạng lưới thần kinh tích chập là một trong những mạng hiệu quả nhất, sử dụng các tính năng, đặc điểm trích xuất từ hình ảnh để nhận biết vật thể là gì. Mạng lưới thần kinh tích chập thường được xây dựng bằng một chương trình máy tính trong các máy chủ hoặc máy tính xách tay, thông thường có hiệu năng cao, có khả năng tiến hành một khối lượng các phép tính rất lớn.

Một trong những thách thức lớn nhất của nhận dạng hình ảnh là khối lượng dữ liệu khổng lồ, phải vận chuyển qua lại giữa bộ nhớ và bộ vi xử lý của hệ thống máy tính, đòi hỏi nhiều thời gian và năng lượng.

Để tối ưu hóa quá trình này, thiết kế phần cứng máy tính có ý nghĩa quan trọng trong việc tối đa hóa dung lượng bộ nhớ và hiệu quả tính toán. Đây chính là những vấn đề mà nhóm nghiên cứu đang cố gắng thực hiện.

Mảng thanh kim loại ngang bộ nhớ điện toán biến đổi thần kinh.

Mảng thanh kim loại ngang bộ nhớ điện toán biến đổi thần kinh.

Cấu trúc mảng thanh ngang

Những cấu trúc mảng thanh ngang bao gồm nhiều thanh kim loại đặt chéo vuông góc và các phần tử bộ nhớ nằm tại các đường giao nhau, trong khi ReRAM là các phần tử bộ nhớ lưu trữ dữ liệu với những trở kháng khác nhau.

Năng lượng cần thiết để truy cập và lưu giữ cơ sở dữ liệu rất nhỏ so với bộ nhớ hiện nay, lợi thế này khiến ReRAM trở thành ứng cử viên đầy triển vọng của một công nghệ tương lai. Trong khi đó, xếp chồng bộ nhớ theo hướng dọc đã phổ biến trong ngành bộ nhớ lưu trữ vì nó có thể đạt được mật độ dữ liệu cao hơn nhiều trong một khu vực hạn chế.

Các mảng thanh ngang dựa trên ReRAM trước đây đã được báo cáo là mạch không có sự ổn định. Các nhà nghiên cứu này giải quyết những hạn chế này bằng cách sử dụng vật liệu ReRAM mới.

Nhóm các nhà khoa học đã kết hợp các yếu tố của hai hệ thống mạng thanh ngang, tạo ra mạng dãy thanh ngang xếp chồng hai lớp, điểm giao tiếp có các phần tử bộ nhớ Pt / HfO2-x / TiN ReRAM. Các cấu trúc Pt Pt / HfO2-x / TiN làm giảm thiểu nhiều vấn đề của mảng thanh ngang sử dụng ReRAM, có thể dẫn đến sự dòng rò không mong muốn qua các lớp bán dẫn. Mảng thanh ngang có cấu trúc thậm chí đơn giản hơn so với các thiết kế trước đó, khiến cấu trúc mới có ưu thế cạnh tranh hơn trong sản xuất.

Để tăng tốc quá trình nhận dạng hình ảnh của mạng, nhóm nghiên cứu phát triển một loại bộ lọc gọi là kernel, được sử dụng để trích xuất các tính năng, đặc điểm cụ thể từ một hình ảnh nhất định, bộ lọc này được sử dụng rộng rãi trong mạng thần kinh tích chập.

GS Hwang chia sẻ: Chúng tôi muốn mở rộng nghiên cứu này thành một hệ thống tích hợp đầy đủ với một mảng thanh ngang lớn hơn (ít nhất 1kb), nhiều khối và mạch điều khiển. Có lẽ bước tiếp theo là kết hợp mạch của chúng tôi như một khối synaptic (khớp thần kinh) ) với chip logic số trường lập trình (tương tự như một mạch nơron), nhưng cuối cùng chúng tôi  muốn tích hợp tất cả các thành phần mạch trong một định dạng cụ thể của mạch tích hợp dành riêng cho ứng dụng.

Theo Advanced Science News
 Chat GPT-5 sắp ra mắt có gì đặc biệt?

Chat GPT-5 sắp ra mắt có gì đặc biệt?

Nhiều nguồn tin cho biết, OpenAI sẽ phát hành thế hệ tiếp theo của mô hình ChatGPT trong vài tháng tới. Đây cũng là sản phẩm quan trọng nhất, giúp công ty này gây tiếng vang, nhận được hàng tỷ USD góp vốn trong hơn một năm qua.
back to top