SoICT Hackathon 2023: AI4ALL

SoICT Hackathon 2023 là sân chơi do Trường CNTT-TT, Đại học BKHN phối hợp với các đối tác tổ chức dành cho các bạn sinh viên và học viên cao học khắp cả nước nhằm thúc đẩy đam mê tìm tòi phát triển các kỹ thuật AI và ứng dụng để giải quyết các bài toán thực tế phục vụ cuộc sống và có ích cho cộng đồng, xã hội. Dữ liệu cung cấp trong cuộc thi là các dữ liệu thực tế, phần lớn đến từ kết quả hợp tác nghiên cứu giữa Trường CNTT-TT và các đơn vị đối tác. Với tổng giá trị giải thưởng lên tới 215 triệu đồng tiền mặt, SoICT Hackathon 2023 hứa hẹn sẽ là một sân chơi đầy hấp dẫn và bổ ích cho các bạn sinh viên.

I. Giới thiệu chung

Đối tượng tham gia là các bạn hiện đang là sinh viên hoặc học viên cao học khắp cả nước. Các bạn vừa bảo vệ ĐATN năm nay nhưng chưa nhận bằng tại thời điểm đăng ký cũng thuộc đối tượng dự thi.

Cuộc thi gồm các track nội dung như sau:

Vietnamese Spoken Language Understanding

REGISTER NOW!!!

AI-Powered Mobile Apps

Vietnamese Handwritten Text Recognition

Routing Optimization

AI-Powered Banking, Finance, Insurance and Securities

Cuộc thi gồm hai giai đoạn: vòng sơ khảo và vòng chung kết.

Tại vòng sơ khảo, các đội sẽ đề xuất ý tưởng và phát triển các giải pháp để giải quyết bài toán theo yêu cầu của từng track. Các đội có kết quả tốt nhất vòng sơ khảo sẽ được lựa chọn vào vòng tiếp theo.

Tại vòng chung kết, các đội tập trung trực tiếp tại Trung tâm BKAI. Các đội cũng phải chuẩn bị slides và báo cáo kỹ thuật về giải pháp của mình để nộp và trình bày cho Ban Giám Khảo. Căn cứ trên kết quả và chi tiết giải pháp của các đội, Ban giám khảo sẽ đánh giá kết quả cuối cùng để quyết định giải thưởng.

II. Cách thức đăng ký

Bước 1: Gửi đơn đăng ký

Mỗi đội không quá 5 thành viên. Mỗi đội có thể đăng ký dự thi nhiều hơn một track. Mỗi cá nhân có thể tham gia nhiều hơn một đội (nhưng bắt buộc các đội đó không được thi đấu cùng một track).

Các đội điền hồ sơ đăng ký theo Biểu mẫu và nộp theo form Tại đây.

Bước 2: Tham gia nhóm zalo và like fanpage của BKAI để cập nhật thông tin và trao đổi với BTC

Tất cả các thành viên của đội cần tham gia vào nhóm zalo (https://zalo.me/g/tevgka254) và theo dõi Facebook event page của cuộc thi để cập nhật và trao đổi các nội dung liên quan tới cuộc thi.

Bước 3: Tạo Team và đăng ký tài khoản trên hệ thống thi

Đối với các track SLU và Handwritten OCR (NAVER): mỗi thành viên đăng ký một tài khoản trên hệ thống aihub.vn và tham gia vào track dự thi. Đội trưởng vào tab Team tạo một đội với tên giống chính xác như tên trong đơn đăng ký gửi BTC. Lưu ý khi tạo team phải chọn mục Allow Requests. Các thành viên khác vào tab Team để tạo request tham gia vào Team do đội trưởng tạo. Cuối cùng đội trưởng cần phê duyệt các thành viên của đội. Chi tiết có thể tham khảo thêm tại Hướng dẫn này (Phần Competition teams).
Đối với track Routing Optimization (SAMSUNG-TIKI): BTC sẽ tạo tài khoản trên hệ thống openerp và gửi cho các đội dựa vào thông tin đăng ký.
Đối với track AI-Powered Mobile Apps (SAMSUNG) và AI-Powered BFIS (VIETCOMBANK): Không cần thực hiện bước này.

III. Các mốc thời gian quan trọng

Hạn đăng ký hồ sơ: 23h59 ngày 08/09/2023
Hạn nộp danh sách các mô hình pre-trained (đối với các track NAVER): 15/9/2023
Vòng sơ khảo: diễn ra online tới hết ngày 22/09/2023
Vòng chung kết: 28-29/10/2023 tại Trung tâm BKAI, Tầng 10, và Phòng 408-409 Toà Nhà B1, Trường CNTT&TT, Đại học BKHN

IV. Cơ cấu giải thưởng

Mỗi track có cơ cấu giải thưởng như sau:

01 Giải Nhất trị giá 1000 USD tiền mặt
01 Giải Nhì trị giá 500 USD tiền mặt
01 Giải Ba trị giá 200 USD tiền mặt
01 Giải Khuyến khích trị giá 100 USD tiền mặt

V. Quy tắc đối với track SLU và Handwritten OCR (NAVER)

Hai track này thi đấu theo hình thức tương tự các cuộc thi trên Kaggle. Sau đây là một số quy tắc chung dành cho cả hai track. Các quy tắc riêng được mô tả chi tiết tại link của mỗi track.

Quy tắc chi tiết SLU – Challenge
Quy tắc chi tiết Vietnamese Handwritten OCR

5.1. Dữ liệu huấn luyện

Các đội chỉ được phép sử dụng dữ liệu thật (real data) do BTC cung cấp để huấn luyện các mô hình. Không được phép dùng thêm dữ liệu thật từ nguồn khác. Không được phép sử dụng tập test (cả public test lẫn private test) dưới bất kỳ hình thức nào để huấn luyện mô hình.
Các đội có thể sử dụng các chiến lược tăng cường dữ liệu (data augmentation) từ các tập dữ liệu do BTC cung cấp. Các đội cũng có thể sử dụng các phương pháp để tạo dữ liệu tổng hợp (synthetic data) hỗ trợ huấn luyện các mô hình.

5.2. Sử dụng mô hình pre-trained

Các đội được phép sử dụng các mô hình pre-trained nhưng phải chỉ rõ cho BTC các mô hình pre-trained mà đội sử dụng. Các mô hình pre-trained sau đó sẽ được chia sẽ cho tất cả các đội tham gia cùng sử dụng.
Các mô hình pre-trained phải được công khai và được huấn luyện cho mục đích chung. Không được phép sử dụng mô hình pre-trained được huấn luyện trực tiếp cho bài toán tương tự như mô tả trong cuộc thi. Ví dụ với track SLU có thể sử dụng các mô hình pre-trained embedding hoặc các mô hình ngôn ngữ (language models); với track Handwritten OCR có thể sử dụng các mô hình pre-trained trên tập ImageNet. Chi tiết được quy định cụ thể trong link của mỗi track.
Các đội đăng ký các mô hình pre-trained mà đội sử dụng theo link này trước ngày 15/9/2023.
Danh sách các mô hình pre-trained các đội sử dụng: XEM TẠI ĐÂY
Danh sách các mô hình pre-trained NAVER-OCR được chấp nhận: XEM TẠI ĐÂY
Danh sách các mô hình pre-trained NAVER-SLU được chấp nhận: XEM TẠI ĐÂY

5.3. Nộp kết quả

Không được chỉnh sửa file kết quả do mô hình của đội sinh ra bằng cách gán nhãn thủ công các dữ liệu trong tập test (bao gồm public test lẫn private test) để nộp cho BTC.
Giai đoạn sơ khảo (public test): mỗi đội được phép nộp tối đa 10 lần mỗi ngày. Trong giai đoạn chung kết (private test) được phép nộp tối đa 5 lần mỗi ngày.
Các đội lọt vào vòng chung kết bắt buộc phải nộp báo cáo kỹ thuật và source code (đóng gói docker) để BTC đánh giá tính đúng đắn của giải pháp và công bố kết quả cuối cùng.
Link nộp kết quả vòng sơ loại: NỘP TẠI ĐÂY

VI. Quy tắc đối với track AI-Powered Mobile Apps (SAMSUNG) và AI-Powered BFIS (VIETCOMBANK)

Trong hai track này, các đội thi đấu theo hình thức Hackathon thông thường. Quy tắc và thể lệ cụ thể mô tả dưới đây.

6.1. Các cá nhân/tập thể dự thi gửi hồ sơ dự thi, gồm có:

– Đơn đăng ký dự thi;

– Bản mô tả ý tưởng/sản phẩm thể hiện tính cấp thiết, điểm nổi bật trong ý tưởng hoặc giải pháp công nghệ, kết quả đạt được khi ứng dụng ý tưởng/sản phẩm vào thực tế.

– Video/ảnh chụp thuyết minh giới thiệu về ý tưởng/sản phẩm (nếu có).

6.2. Vòng hồ sơ

Từ ngày 08/9/2023 đến 15/9/2023: Hội đồng chuyên môn duyệt hồ sơ để chọn các đội đủ điều kiện trình bày trước BGK Vòng sơ khảo.

6.3. Vòng sơ khảo

15/9/2023-22/9/2023: Ban giám khảo tổ chức chấm sơ khảo để lựa chọn dự kiến 10 ý tưởng/sản phẩm xuất sắc nhất mỗi track để vào Vòng Chung kết.

Các đội thi ở xa có thể trình bày và phỏng vấn trực tuyến.

6.4. Vòng chung kết và trao giải

– Các đội thi tập trung tại tầng 10 Trung tâm BKAI và có thời gian 24 tiếng liên tục để hoàn thiện sản phẩm dự thi, cũng như chuẩn bị demo và bài trình bày sản phẩm;
– Kết thúc 24h, các đội thi trình bày sản phẩm (có kết hợp demo) trước Ban giám khảo;
– Thời gian trình bày trước Ban giám khảo từ 10-15 phút;
– Ban giám khảo tiến hành chấm và xếp giải nhất, nhì, ba và giải khuyến khích.
– Kết quả được công bố tại Lễ trao giải và khen thưởng các cá nhân/tập thể dự thi đạt giải.

6.5. Các bài toán gợi ý

6.5.1. SAMSUNG: AI-Power Mobile Apps

Tất cả các ý tưởng/sản phẩm ứng dụng AI và triển khai trên mobile đều phù hợp với tiêu chí của track này. Các bài toán gợi ý, nhưng không giới hạn, bao gồm:

– Multimedia image/video processing on mobile devices

Object Classification
Object Detection
Object Tracking
Segmentation
Super Resolution
Pose Estimation
Face Recognition
Emotion Recognition
Face Anti Spoofing
Action Recognition
Video Stablization
Remove Unwanted Object
Automatic Photo Adjusment (Tone, Contrast, Color,..)
Context search on visual database (image/video)
Prompt Image Editing

– Voice and Speech Recognition Apps

Speaker Diarisation (Speaker Label)
Language Identification (Language Auto-Detection)
Multilingual Speech Recognition
Speech Emotion Recognition
Audio Classification
Audio Source Separation
Audio Context Detection
Voice Authentication/Speech Verification
Audio Filtering
Speech Punctuation
Keyword Spotting
Speech Summarization

– Virtual Try-On

– Health and Fitness Apps

– Virtual Assistants

– Mini LLMs on mobile devices

– Stable Diffusion for Image Generation and Editing

6.5.2. VIETCOMBANK: AI-Powered BFIS

Track này liên quan tới việc ứng dụng AI trong BFIS (Banking, Finance, Insurance and Securities) nhằm đưa giải pháp/sản phẩm tài chính đến người dùng cuối dễ dàng và hiệu quả.
Mục tiêu khi đưa ra chủ đề là định hướng cho SV, gợi ý nhưng không hạn chế sự sáng tạo. Các bài toán liên quan, nhưng không giới hạn, có thể kể đến như:
– AI trong truyền thông/tương tác đa chiều
– AI về phân tích cơ hội đầu tư, thẩm định khách hàng, đánh giá tín dụng, tư vấn quản lý tài chính cá nhân
– AI trong định danh khách hàng (eKYC)
– Các bài toán liên quan tới dự đoán, dự báo, xử lý dữ liệu lớn nói chung và ứng dụng trong lĩnh vực BFIS

VII. Quy tắc đối với track Routing Optimization (SAMSUNG-TIKI)

Các đội lập trình để giải quyết một bài toán NP-hard theo hình thức lập trình thi đấu và nộp code trực tiếp lên hệ thống để tự động chấm điểm.

Chủ đề: Thuật toán phân đơn hàng và lập lộ trình cho đội xe tải giao vận trong thương mại điện tử

Nhiệm vụ: Đề xuất và phát triển thuật toán hiệu quả giải bài toán chia đơn và lập lộ trình cho các xe tải thực hiện nghiệp vụ vận chuyển các đơn hàng giữa các điểm (Hub) của công ty giao vận thỏa mãn ràng buộc về khung thời gian, tải trọng của các xe và tối ưu một số tiêu chí: số đơn hàng được vận chuyển, số xe sử dụng, tổng thời gian di chuyển các xe).

Công cụ đánh giá: Ban tổ chức sẽ cung cấp một công cụ phần mềm (website) để các đội nộp mã nguồn (source code) giải pháp, trên website có một danh sách các bộ dữ liệu test. Mã nguồn của các đội cần tuân thủ chặt chẽ định dạng dữ liệu đầu vào và kết quả trả ra để hệ thống sẽ chạy tự động mã nguồn của các đội, tự động đánh giá chất lượng (dựa trên các tiêu chí tối ưu đề ra) của kết quả đầu ra và xếp hạng.

Tiêu chí đánh giá: Với mỗi bộ dữ liệu (instance), 10 đội thi có lời giải tốt nhất sẽ được từ 1 tới 10 điểm, đội có kết quả tốt nhất sẽ được 10 điểm, các đội thi nằm ngoài top 10 sẽ không có điểm. Tiêu chí so sánh 2 lời giải bao gồm: số lượng xe tải dùng ít nhất, tổng thời gian di chuyển của các xe tải và thời gian chạy của thuật toán. Các đội sẽ được cung cấp 1 số bộ dữ liệu test (public) để phát triển giải pháp. Vòng chung kết, các đội sẽ thi trên các bộ dữ liệu test chính thức (private)

Thể lệ:
– Tài nguyên tính toán sẽ được giới hạn, cụ thể giới hạn về thời gian và bộ nhớ;
– Với mỗi bộ dữ liệu test, mỗi đội thi không được submit quá một số lần cho phép;
– Bộ dữ liệu test tại vòng public sẽ khác với bộ dữ liệu test tại vòng private.

Link nộp kết quả vòng sơ loại: NỘP TẠI ĐÂY

Events