OpenAI sử dụng GPTbot để tự động thu thập dữ liệu từ internet

OpenAI đã phát triển GPTbot để tự động thu thập dữ liệu từ các trang web toàn cầu. Mục tiêu là cải thiện độ chính xác và an toàn của mô hình AI, nhưng lo ngại rằng điều này có thể gây hại đến internet.

Theo OpenAI, GPTbot được tạo ra để hỗ trợ huấn luyện AI. Nó sẽ giúp mô hình GPT-5 và ChatGPT tổng hợp thông tin và trả lời câu hỏi mà không cần người dùng phải truy cập các liên kết.

Tuy nhiên, như The Verge đã đưa tin, một số trang web đã bắt đầu chặn GPTbot. OpenAI cũng cho phép người dùng từ chối cho GPTbot thu thập dữ liệu từ trang web của họ.

GPTbot, ChatGPT, OpenAI

Sự ra đời của GPTbot đang tạo nên mối lo ngại rộng rãi. Các công cụ tương tự như GPTbot có thể làm cho nhiều trang web mất lưu lượng truy cập, khi người dùng không cần truy cập trực tiếp đến trang web mà vẫn nhận được thông tin thông qua AI.

Các nhà sáng tạo nội dung cũng đối diện với việc mất niềm tin vào OpenAI, vì những công cụ như GPTbot và CCbot của Common Crawl đang thu thập dữ liệu từ trang web của họ để huấn luyện AI.

Mặc dù OpenAI khẳng định rằng GPTbot đã được lập trình để tránh thu thập thông tin cá nhân và nội dung có phí, vấn đề về quyền lợi và sự hợp tác giữa các bên vẫn đang đặt ra nhiều thách thức.

Trong tương lai, OpenAI cần phải tìm cách hợp tác với các nhà lập pháp và chủ sở hữu trang web để đảm bảo việc thu thập dữ liệu diễn ra trong một khung pháp lý rõ ràng và có lợi cho cả các bên liên quan.

Nobita
Nobita

Nobita là đồng sáng lập Tech Insider. Anh từng cộng tác cho nhiều trang tin công nghệ, báo chí mảng tin tức công nghệ nổi tiếng ở Việt Nam. Tech Insider được anh xem như 'ngôi nhà ở ẩn' sau một thời gian 'mải mê chinh chiến và yêu đương'.


Tech Biz

Jensen Huang sợ đám đông

Jensen Huang: Vị CEO quyền lực nhưng ngại đứng trước đám đông.

FAHASA khai trương cùng lúc 2 nhà sách mới ở trung tâm TPHCM

Sau một thời gian dài chuẩn bị, ngày 9/8, Công ty Fahasa chính thức khai trương hai nhà sách: Fahasa Hùng Vương và Fahasa Ba tháng Hai tại các vị trí trung tâm TP.HCM, hoà vào không khí tưng bừng nhiều hoạt động chào mừng sinh nhật lần thứ 48.

Tác giả Việt Nam Top 1 Best Seller trong lĩnh vực Global Marketing chia sẻ  ‘Hành trình xuất khẩu tri thức’

Tác giả Võ Minh Quân (bút danh Quân Võ) nổi danh với cuốn sách tiếng Anh “Profit-driven digital marketing”, xuất bản tháng 3/2024 vừa qua. Ngay khi ra mắt, sách đã nhanh chóng đạt danh hiệu Top New Releases rồi sau đó đạt Top 1 Best Seller trong lĩnh vực Global Marketing (Tiếp Thị Toàn Cầu) trên Amazon sau một tháng từ lúc xuất bản. Mới đây, tác giả Võ Minh Quân đã có những chia sẻ kinh nghiệm làm sách và đưa tri thức Việt Nam ra thế giới.

SCG đồng hành với chương trình ‘Em và Ước mơ nghề nghiệp’.

Nhân ngày Quốc tế Thiếu nhi 2024, SCG tiếp tục đồng hành với trường Nuôi dạy trẻ Khuyết tật tỉnh Bà Rịa - Vũng Tàu trong chương trình ‘Em và Ước mơ nghề nghiệp’.


Tech How

Tuyệt chiêu tìm camera giấu kín trong khách sạn, nhà nghỉ

Trong 5 cách được các chuyên gia thử nghiệm, chỉ một cách phát huy được khả năng phát hiện camera giấu kín trong phòng. Hãy cùng xem là cách nào đây nhé anh em.

Dùng AI tạo hồ sơ xin việc mới là thời thượng

Đừng hì hục làm CV xin việc nữa khi mà bạn đã có những trợ lí AI chất lượng dưới đây.

Top 15 mẹo để tận dụng tối đa điện thoại Android của bạn

Những mẹo để tận dụng tói đa điện thoại Android, bạn đã biết chưa?

Video hướng dẫn làm dụng cụ cho gà ăn từ chai nhựa, xi măng

Đây là cách làm dụng cụ cho gà ăn từ chai nhựa, xi măng một cách đơn giản nhất.