Code Velocity
Mô hình AI

Tải tệp lên ChatGPT: Phân tích tài liệu & Thu thập thông tin chi tiết nâng cao

·5 phút đọc·OpenAI·Nguồn gốc
Chia sẻ
Giao diện ChatGPT hiển thị biểu tượng tải tệp lên và nhiều loại tài liệu khác nhau đang được xử lý để phân tích dữ liệu AI

OpenAI tiếp tục đẩy xa ranh giới tiện ích của AI, và bản nâng cấp mới nhất cho ChatGPT đánh dấu một bước tiến đáng kể trong tương tác tài liệu và phân tích dữ liệu. Khả năng tải tệp lên ChatGPT mới này đã thay đổi cách người dùng tương tác với các tài liệu giàu văn bản, tận dụng mô hình Phân tích Dữ liệu Nâng cao mạnh mẽ (trước đây là Code Interpreter) để khai thác những thông tin chi tiết sâu sắc hơn từ nhiều định dạng khác nhau. Bản cập nhật này hứa hẹn sẽ hợp lý hóa quy trình làm việc cho cả các chuyên gia và người dùng thông thường, mang lại khả năng phân tích vô song trực tiếp trong giao diện ChatGPT quen thuộc.

Mở rộng khả năng phân tích dữ liệu của ChatGPT với tính năng tải tệp lên

Việc tích hợp chức năng tải tệp lên ChatGPT là một bước phát triển then chốt, vượt ra ngoài các lời nhắc văn bản đơn giản để cho phép tương tác phức tạp với toàn bộ tài liệu. Tính năng này được thiết kế để trao quyền cho người dùng với ba khả năng cốt lõi: Tổng hợp (Synthesis), Chuyển đổi (Transformation) và Trích xuất (Extraction), cách mạng hóa cách thông tin được xử lý và hiểu.

Tổng hợp (Synthesis): Tạo thông tin chi tiết mới từ dữ liệu hiện có

Với tính năng tổng hợp, ChatGPT có thể phân tích và kết hợp thông tin từ nhiều tệp khác nhau để tạo ra những thông tin chi tiết mới lạ. Hãy hình dung việc tải lên nhiều bài báo nghiên cứu và yêu cầu ChatGPT so sánh và đối chiếu các phương pháp luận của chúng, hoặc cung cấp một bảng tính chứa cả dữ liệu định tính và định lượng để AI trực quan hóa và giải thích. Khả năng này lý tưởng cho:

  • Phân tích So sánh: Nhanh chóng xác định điểm tương đồng và khác biệt giữa các tài liệu.
  • Phân tích Cảm xúc: Hiểu sắc thái và nội dung cảm xúc trong các khối văn bản lớn.
  • Trực quan hóa Dữ liệu: Xử lý dữ liệu bảng tính thô thành biểu đồ và tóm tắt dễ hiểu.
  • Ứng dụng Khung: Áp dụng một tiêu chí từ tài liệu này để đánh giá nội dung của tài liệu khác.

Chuyển đổi (Transformation): Định hình lại thông tin để rõ ràng hơn

Chuyển đổi cho phép người dùng thay đổi định dạng hoặc độ phức tạp của thông tin mà không làm mất đi bản chất của nó. Điều này đặc biệt hữu ích để đơn giản hóa các chủ đề phức tạp hoặc điều chỉnh nội dung cho các đối tượng khác nhau. Ví dụ bao gồm:

  • Đơn giản hóa Văn bản Phức tạp: Biến một bài báo nghiên cứu dày đặc thành một bản tóm tắt dễ hiểu.
  • Phản hồi Nội dung: Nhận phản hồi mang tính xây dựng về các bản trình bày hoặc báo cáo.
  • Điều chỉnh Phong cách: Viết lại một tài liệu theo một sắc thái hoặc phong cách cụ thể.
  • Chuyển đổi Định dạng: Chuyển đổi bản trình bày thành tài liệu chi tiết để phân phối rộng rãi hơn.

Trích xuất (Extraction): Truy xuất dữ liệu chính xác

Khả năng trích xuất cho phép ChatGPT xác định và lấy thông tin cụ thể từ tài liệu với độ chính xác cao. Điều này có thể tiết kiệm vô số giờ tìm kiếm thủ công, biến nó thành một công cụ không thể thiếu cho các nhiệm vụ nghiên cứu và hành chính:

  • Xác định Chủ đề: Tìm tất cả các đề cập về một chủ đề cụ thể trên nhiều tệp PDF hoặc bảng tính.
  • Truy xuất Trích dẫn: Ngay lập tức lấy các trích dẫn liên quan từ các văn bản dài.
  • Trích xuất Siêu dữ liệu: Truy cập tác giả, ngày tạo và các siêu dữ liệu quan trọng khác.
  • Trích xuất Dữ liệu Có cấu trúc: Đếm các hàng có thuộc tính cụ thể trong bảng tính hoặc trích xuất tất cả các tiêu đề từ một tài liệu.

Các loại tệp được hỗ trợ và hạn chế tải lên

OpenAI đã đảm bảo khả năng tương thích rộng rãi cho tính năng tải tệp lên ChatGPT, hỗ trợ các phần mở rộng tệp phổ biến cho tài liệu văn bản, bảng tính và bản trình bày. Điều này bao gồm các định dạng phổ biến như PDF, tài liệu Microsoft Word (.docx), bảng tính Excel (.xlsx, .csv) và bản trình bày PowerPoint (.pptx).

Tuy nhiên, người dùng nên lưu ý các giới hạn cụ thể về số lượng và kích thước tệp để đảm bảo hiệu suất tối ưu và tránh vượt quá giới hạn sử dụng.

Các giới hạn tải tệp toàn diện:

Danh mụcGiới hạnGhi chú
Kích thước tệp riêng lẻ512 MB mỗi tệpGiới hạn cứng cho tất cả các loại tệp
Giới hạn Token cho Văn bản/Tài liệu2 triệu token mỗi tệpÁp dụng cho tệp văn bản và tài liệu; bảng tính được miễn trừ
Kích thước CSV/Bảng tính~50 MBPhụ thuộc vào kích thước hàng và độ phức tạp
Kích thước hình ảnh20 MB mỗi hình ảnhĐối với hình ảnh được tải lên trong tài liệu hoặc riêng biệt
Số tệp mỗi GPTTối đa 10 tệp trong suốt thời gian tồn tại của custom GPTNhững tệp này đóng góp vào giới hạn người dùng/tổ chức
Giới hạn tải lên của người dùngTổng cộng 10 GBCho mỗi người dùng cuối cá nhân
Giới hạn tải lên của tổ chứcTổng cộng 100 GBCho mỗi tổ chức
Tần suất tải lên80 tệp sau mỗi 3 giờ (người dùng đăng ký)Giới hạn có thể giảm trong giờ cao điểm
Tải lên của người dùng miễn phí3 tệp mỗi ngàyTruy cập hạn chế cho người không đăng ký
Giới hạn dự án (Plus)Tối đa 20 tệp mỗi dự ánDành cho người dùng ChatGPT Plus
Giới hạn dự án (Pro, Team, Education, Business)Tối đa 40 tệp mỗi dự ánGiới hạn cao hơn cho các cấp đăng ký nâng cao

Điều quan trọng cần lưu ý là mặc dù các giới hạn này đã được thiết lập, ChatGPT hiện không cung cấp cách nào để người dùng theo dõi hạn mức tải lên còn lại của họ. Một thông báo lỗi sẽ xuất hiện nếu đã đạt đến giới hạn.

Chính sách lưu giữ, xóa và quyền riêng tư dữ liệu đối với các tệp đã tải lên

OpenAI duy trì các chính sách rõ ràng liên quan đến việc lưu giữ và quyền riêng tư dữ liệu đối với các tệp đã tải lên ChatGPT để đảm bảo sự tin tưởng của người dùng và tuân thủ các quy định. Hiểu rõ các chính sách này là rất quan trọng để quản lý dữ liệu của bạn một cách hiệu quả.

Quản lý và xóa tệp

Nếu bạn gặp phải giới hạn sử dụng hoặc chỉ đơn giản là muốn xóa dữ liệu của mình, các tệp đã tải lên Phân tích Dữ liệu Nâng cao có thể được xóa. Điều này có thể được thực hiện bằng cách xóa các tệp khỏi các cuộc trò chuyện gần đây hoặc từ bất kỳ custom GPT nào bạn đã xây dựng, vì chúng có chung giới hạn tổng thể. Thời gian lưu giữ các tệp khác nhau tùy theo gói đăng ký của bạn.

Chính sách lưu giữ cuộc trò chuyện so với tệp

  • Cuộc trò chuyện: Các cuộc trò chuyện của bạn được lưu trong tài khoản cho đến khi bạn xóa chúng. Sau khi xóa cuộc trò chuyện hoặc toàn bộ tài khoản của bạn, dữ liệu sẽ bị xóa khỏi hệ thống của OpenAI trong vòng 30 ngày, trừ khi được ẩn danh hóa hoặc yêu cầu cho các lý do pháp lý/bảo mật. Bạn có thể tìm thêm chi tiết trong Câu hỏi thường gặp về kiểm soát dữ liệu.
  • Tệp: Các tệp được tải lên ChatGPT được giữ lại trong tài khoản của bạn trong suốt thời gian lưu giữ của cuộc trò chuyện tương ứng. Các tệp được thêm làm kiến thức vào một custom GPT sẽ tồn tại cho đến khi custom GPT đó bị xóa. Tương tự như cuộc trò chuyện, việc xóa một cuộc trò chuyện chứa tệp, tài khoản của bạn hoặc một custom GPT sẽ bắt đầu quá trình xóa 30 ngày đối với các tệp liên quan. Đối với các tệp được xử lý thông qua Phân tích Dữ liệu Nâng cao hoặc được trò chuyện trực tiếp với một custom GPT (không phải là kiến thức), thời gian lưu giữ phụ thuộc vào gói. Để đọc thêm, hãy tham khảo Cách lưu giữ tệp so với cuộc trò chuyện?.

Đào tạo mô hình và xử lý nội dung hình ảnh

Một trong những câu hỏi thường gặp nhất xoay quanh việc liệu OpenAI có sử dụng các tệp đã tải lên để đào tạo mô hình hay không và cách xử lý nội dung hình ảnh trong tài liệu. OpenAI cung cấp các câu trả lời riêng biệt dựa trên loại dịch vụ và gói đăng ký.

Sử dụng dữ liệu để cải thiện mô hình

OpenAI phân biệt giữa các dịch vụ dành cho người tiêu dùng và doanh nghiệp:

  • Dịch vụ người tiêu dùng (ChatGPT, DALL·E): Nội dung được gửi, bao gồm các tệp đã tải lên, có thể được sử dụng để cải thiện hiệu suất mô hình. OpenAI cung cấp thông tin về cách dữ liệu này được sử dụng và các lựa chọn mà người dùng có đối với dữ liệu của họ.
  • Dịch vụ doanh nghiệp (API, ChatGPT Enterprise): Nội dung được khách hàng gửi đến các dịch vụ này không được sử dụng để cải thiện hiệu suất mô hình. Cam kết về quyền riêng tư doanh nghiệp này là nền tảng cho các khách hàng doanh nghiệp. Bạn có thể tìm thêm chi tiết về cách quản lý dữ liệu doanh nghiệp trên trang Quyền riêng tư doanh nghiệp của OpenAI.

Xử lý hình ảnh được nhúng

Khả năng xử lý hình ảnh được nhúng trong tài liệu, bản trình bày hoặc tệp PDF của ChatGPT khác nhau tùy theo gói và loại tệp:

  • ChatGPT Enterprise: Gói này hỗ trợ Truy xuất Hình ảnh (Visual Retrieval) cho các tệp PDF. Điều này có nghĩa là người dùng Enterprise có thể tận dụng AI để diễn giải và phân tích các yếu tố hình ảnh trong tệp PDF, mang lại sự hiểu biết tài liệu toàn diện hơn.
  • Các gói khác: Đối với ChatGPT Plus và các cấp đăng ký khác, cũng như đối với các tệp tài liệu không phải PDF, hệ thống chủ yếu hỗ trợ truy xuất dựa trên văn bản. Trong những trường hợp này, ChatGPT sẽ trích xuất văn bản kỹ thuật số từ tệp và loại bỏ bất kỳ hình ảnh nào được nhúng, chỉ tập trung phân tích vào nội dung văn bản.

Tối đa hóa hiệu quả với tính năng tải tệp lên ChatGPT

Để thực sự khai thác tiềm năng của khả năng phân tích tài liệu nâng cao của ChatGPT, người dùng nên áp dụng các phương pháp hay nhất để tối ưu hóa tương tác của họ. Kỹ thuật tạo lời nhắc (prompt engineering), chẳng hạn, vẫn là yếu tố tối quan trọng. Việc xác định rõ ràng mục tiêu của bạn khi tải tệp lên – cho dù đó là để tổng hợp, chuyển đổi hay trích xuất – sẽ mang lại kết quả chính xác và phù hợp hơn. Ví dụ, thay vì chỉ tải lên một báo cáo và hỏi 'Tóm tắt cái này', hãy thử 'Tóm tắt báo cáo này, làm nổi bật các phát hiện chính liên quan đến xu hướng thị trường và đề xuất ba chiến lược khả thi dựa trên dữ liệu'.

Việc tận dụng mô hình Phân tích Dữ liệu Nâng cao một cách hiệu quả có nghĩa là phải suy nghĩ kỹ về các câu hỏi bạn đưa ra. Hãy xem xét ngữ cảnh, định dạng đầu ra mong muốn và bất kỳ ràng buộc cụ thể nào. Đối với các tập dữ liệu phức tạp trong bảng tính, việc yêu cầu các phép tính cụ thể hoặc nhận dạng mẫu có thể biến các số liệu thô thành thông tin tình báo có thể hành động. Đối với các tác vụ sáng tạo, như viết lại tài liệu, hãy chỉ định giọng điệu, đối tượng và độ dài yêu cầu. Sự chính xác này, kết hợp với các khả năng tải tệp mới, trao quyền cho ChatGPT hoạt động như một trợ lý ảo tinh vi cao cấp để quản lý và phân tích thông tin. Bạn có thể tìm thêm thông tin chi tiết về cách tạo lời nhắc hiệu quả trong các hướng dẫn như Các phương pháp hay nhất để tạo lời nhắc với API OpenAI.

Tương lai của tương tác tài liệu được hỗ trợ bởi AI

Khả năng tải tệp lên ChatGPT mới đại diện cho một cột mốc quan trọng trong việc làm cho AI trở nên dễ tiếp cận và thực tế hơn cho các công việc hàng ngày liên quan đến xử lý tài liệu. Bằng cách mở rộng sức mạnh phân tích của các mô hình để xử lý nhiều định dạng tệp đa dạng, OpenAI đã định vị ChatGPT như một công cụ không thể thiếu hơn nữa cho các chuyên gia trong nhiều ngành khác nhau. Từ các nhà nghiên cứu và nhà phân tích dữ liệu đến các nhà văn và chiến lược gia kinh doanh, khả năng tương tác dễ dàng và thu thập thông tin chi tiết từ tài liệu trực tiếp trong giao diện AI hứa hẹn sẽ định nghĩa lại năng suất và thúc đẩy sự hiểu biết sâu sắc hơn trong một thế giới ngày càng giàu dữ liệu. Khi OpenAI tiếp tục tinh chỉnh và mở rộng các tính năng này, chúng ta có thể mong đợi những cách thức trực quan và mạnh mẽ hơn nữa để cộng tác với AI trong các thách thức thông tin phức tạp.

Câu hỏi thường gặp

What new capabilities do file uploads bring to ChatGPT users?
OpenAI has significantly enhanced ChatGPT by integrating a new file upload capability, building upon its existing Advanced Data Analysis model (formerly Code Interpreter). This upgrade allows users to upload and interact with various document types, including PDFs, Microsoft Word documents, and presentations. The primary focus is to improve performance on text-rich documents, enabling users to perform sophisticated tasks such as data synthesis, information transformation, and precise data extraction directly within their ChatGPT conversations, making it an invaluable tool for researchers, analysts, and anyone dealing with large volumes of information.
Which ChatGPT subscription plans and platforms support the file upload feature?
The advanced file upload capability is currently available to all ChatGPT Plus and ChatGPT Enterprise users. It can be accessed directly on the web at chatgpt.com, as well as through OpenAI's iOS and Android mobile applications. OpenAI has also indicated that this feature will be coming soon via its API, extending its utility for developers and custom applications. Free users have more limited access, capped at three file uploads per day, highlighting the premium nature of the enhanced functionality for subscribers.
What are the primary use cases and functionalities supported by ChatGPT's file uploads?
ChatGPT's file upload feature is designed to support three core functionalities: Synthesis, Transformation, and Extraction. Synthesis involves combining or analyzing information from multiple files to generate new insights, like comparing documents or analyzing sentiment. Transformation focuses on reshaping information without altering its essence, such as summarizing complex research papers or converting presentations into documents. Extraction allows users to pull specific information, like relevant quotes, topic mentions, or metadata, from various file types efficiently, significantly streamlining data processing workflows.
What are the specific file size and quantity restrictions for uploading documents to ChatGPT?
Users face several restrictions when uploading files. Individual files have a hard limit of 512MB. Text and document files are capped at 2 million tokens per file, though this token limit does not apply to spreadsheets. CSVs or spreadsheets cannot exceed approximately 50MB, and images are limited to 20MB each. There are also usage caps: 10GB per end-user and 100GB per organization. Users can upload up to 80 files every three hours, with free users limited to 3 daily uploads. Project-based limits vary by plan, with Plus users getting 20 files per project and higher tiers (Pro, Team, Education, Business) receiving 40 files.
How does OpenAI handle the retention and deletion of uploaded files and chat data?
Chats are saved in your account until manually deleted. Once deleted, they are removed from OpenAI systems within 30 days, unless de-identified or kept for legal/security reasons. Files uploaded directly to ChatGPT conversations are retained up to the retention period of the corresponding chat. Files uploaded as knowledge for a custom GPT are kept until that GPT is deleted. Deleting a chat, account, or custom GPT initiates a 30-day deletion process for associated files. For files processed via Advanced Data Analysis or custom GPTs (not as knowledge), retention varies based on the user's plan, underscoring OpenAI's commitment to data management.
Does ChatGPT process images embedded within uploaded documents, or only text?
The ability to process embedded images depends on your ChatGPT plan and the file type. For ChatGPT Enterprise users, Visual Retrieval is supported specifically for PDF files, meaning the AI can interpret and analyze visual elements within those documents. However, for all other plans and document types, ChatGPT primarily supports text-based retrieval. This means that while digital text will be extracted and analyzed, any images embedded within those files will generally be discarded and not processed by the AI, focusing the analysis solely on the textual content.
Will files uploaded to ChatGPT be utilized by OpenAI to train its underlying AI models?
OpenAI's policy on using uploaded files for model training varies depending on the service. For consumer-facing services like ChatGPT and DALL·E, content submitted, including uploaded files, may be used to improve model performance, as detailed in their data usage policies. Users typically have choices regarding this data usage. Crucially, content submitted by customers to OpenAI's business offerings, such as the API and ChatGPT Enterprise, is explicitly *not* used to improve model performance. This distinction underscores OpenAI's commitment to enterprise privacy and data security for its business clients.

Cập nhật tin tức

Nhận tin tức AI mới nhất qua email.

Chia sẻ