DALL-E 3, trình tạo hình ảnh mới nhất của OpenAI là gì, cách sử dụng DALL-E 3, #allfreevn chia sẻ tất cả về DALL-E 3, có thể thêm văn bản (không nhảm) vào hình ảnh.
Dall-E 3 là gì?
Dall-E 3, công cụ trí tuệ nhân tạo nghệ thuật mới nhất của OpenAI. Nó sử dụng chatbot phổ biến của OpenAI, ChatGPT, để giúp tạo ra các tác phẩm nghệ thuật phức tạp hơn, được sáng tác cẩn thận hơn bằng cách tự động điều chỉnh tỷ lệ dựa trên các tín hiệu theo cách cung cấp cho trình tạo các hướng dẫn chi tiết, nhất quán hơn.
Điểm mới ở Dall-E 3 là cách nó loại bỏ một số độ phức tạp cần thiết để điều chỉnh văn bản được cung cấp cho chương trình (cái gọi là “kỹ thuật nhắc nhở”) và cách nó cho phép người dùng hiển thị các điều chỉnh thông qua giao diện hội thoại của ChatGPT. Công cụ mới này có thể giúp hạ thấp tiêu chuẩn tạo ra các tác phẩm nghệ thuật AI phức tạp và có thể giúp OpenAI dẫn đầu đối thủ cạnh tranh nhờ khả năng chatbot của mình.
Như một trang thông tin mới về DALL-E 3 trên trang web OpenAI lưu ý: “Các hệ thống chuyển đổi văn bản thành hình ảnh hiện đại có xu hướng bỏ qua các từ hoặc mô tả, buộc người dùng phải học kỹ thuật này một cách nhanh chóng. “DALL-E 3 đại diện cho một bước tiến trong công nghệ của chúng tôi.” khả năng tạo hình ảnh tuân thủ chính xác với văn bản bạn cung cấp.”
Open AI cho biết sẽ tích hợp trực tiếp DALL-E 3 vào ChatGPT và ngụ ý mạnh mẽ rằng chatbot sẽ chuyển từ mô hình này sang mô hình khác, tùy thuộc vào nội dung tin nhắn. Trước đây hoàn toàn là một trình kết nối văn bản dễ sử dụng của mẫu GPT-3.5, ChatGPT đang phát triển nhanh chóng, kết hợp các plugin của bên thứ ba với khả năng trích xuất văn bản từ các nguồn khác, bao gồm cả web. Động thái này tiếp tục đa dạng hóa khả năng của ChatGPT, mở rộng định nghĩa vốn đã căng thẳng về thuật ngữ “chatbot”.
Theo Altman, DALL-E 3 “sẽ có sẵn cho tất cả người dùng ChatGPT+ trong vài tuần tới.” Trang web của OpenAI cho biết tất cả khách hàng ChatGPT Plus và ChatGPT Enterprise sẽ có thể sử dụng nó “vào đầu tháng 10” và OpenAI sẽ không đưa ra bất kỳ khiếu nại bản quyền nào đối với đầu ra của mô hình.
đây là dalle 3, theo ý kiến của tôi thì khá tuyệt vời: https://t.co/UcPPehWxnQ
sẽ đến với tất cả người dùng chatgpt+ trong những tuần tới.
công việc tuyệt vời của @mechanical_model (sếp dall-e), @neobjb @gabeeeegoooh @jingli911 (các IC lãnh đạo dalle khác) và toàn bộ nhóm. pic.twitter.com/8wtWffpXkQ
—Sam Altman (@sama) Ngày 20 tháng 9 năm 2023
Loại tác phẩm nghệ thuật kỳ quặc do AI tạo ra này đã trở nên phổ biến trên mạng xã hội nhờ nhiều công cụ khác nhau giúp chuyển đổi lời nhắc văn bản thành thiết kế trực quan.
Loại tác phẩm nghệ thuật kỳ quặc do AI tạo ra này đã trở nên phổ biến trên mạng xã hội nhờ một số công cụ chuyển đổi lời nhắc văn bản thành thiết kế trực quan. Nhưng ứng dụng này được tạo ra với sự hỗ trợ nghệ thuật đáng kể từ ChatGPT, chỉ lấy một tin nhắn ngắn và biến nó thành một tin nhắn chi tiết hơn, bao gồm cả hướng dẫn cách soạn tin nhắn một cách chính xác.
Đó là một bước tiến lớn không chỉ đối với Dall-E mà còn đối với nghệ thuật AI nói chung. Dall-E, từ viết tắt của nhân vật Pixar Wall-E và nghệ sĩ Salvador Dalí được công bố vào năm 2021 và phát hành vào năm 2022, bao gồm một thuật toán cung cấp một số lượng lớn hình ảnh được gắn nhãn lấy từ web và các nguồn khác. Nó sử dụng cái được gọi là mô hình khuếch tán để dự đoán hình ảnh sẽ xuất hiện như thế nào đối với một thông báo nhất định. Với lượng dữ liệu đủ lớn, điều này có thể tạo ra những hình ảnh phức tạp, mạch lạc và có tính thẩm mỹ. Điều làm nên sự khác biệt của Dall-E 3 nằm ở cách con người và máy móc tương tác với nhau.
Hình ảnh này do Dall-E 3 hiển thị cho thấy cách sử dụng ChatGPT để hoàn thành tin nhắn sẽ tạo ra một hình ảnh mạch lạc và tinh tế hơn như thế nào. Nó thường có thể yêu cầu nhiều kỹ thuật nhanh chóng, trong đó người dùng thử các lời nhắc ngày càng phức tạp để tạo ra thứ gì đó phức tạp. Nhưng với Dall-E 3, ChatGPT đảm nhận nhiệm vụ tạo những lời nhắc phức tạp hơn.
Dall-E 3 đã tạo ra hình ảnh này để đáp lại thông điệp sau: “Minh họa trái tim con người làm bằng kính mờ, trên bệ giữa biển giông bão. Tia nắng xuyên qua mây, chiếu sáng trái tim, lộ ra một vũ trụ nhỏ bên trong. Câu nói “Tìm vũ trụ bên trong bạn” được khắc bằng chữ in đậm dọc theo đường chân trời.
Dall-E 3 cũng sẽ cho phép người dùng điều chỉnh tác phẩm thông qua ChatGPT, như thể họ đang yêu cầu một nghệ sĩ thực sự thực hiện các thay đổi. Aditya Ramesh, nhà điều tra chính và lãnh đạo nhóm Dall-E cho biết: “Bạn thực sự sẽ không phải lo lắng về việc chơi với những lời nhắc mở rộng. “Thay vào đó, bạn có thể tương tác với ChatGPT như thể bạn đang nói chuyện với đồng nghiệp.”
Gabriel Goh, nhà nghiên cứu chính của nhóm Dall-E, đã trình diễn thủ thuật này cho WIRED bằng cách yêu cầu Dall-E 3 tạo một số bảng quảng cáo cho một nhà hàng mì tưởng tượng. Sau khi được đưa ra một vài lựa chọn, Goh đã yêu cầu Dall-E 3, thông qua ChatGPT, lấy một trong số chúng và biến nó thành hình minh họa tấm biển treo bên ngoài một nhà hàng.
Dall-E 3 hiện đã có mặt trên ChatGPT Plus, phiên bản trả phí của chatbot, chia sẻ #allfreevn.
DALL-E 3 có thân thiện với người sáng tạo hơn không?
Kể từ khi DALL-E được phát hành lần đầu tiên vào năm 2019, quá trình đào tạo và khả năng vi phạm bản quyền của nó đã là nguồn gốc của nhiều tranh cãi.
Giống như ChatGPT, DALL-E 2 được đào tạo trên hàng triệu hình ảnh được lấy từ web mà không nhất thiết phải có sự đồng ý của chủ sở hữu chúng. Mặc dù điều này mở ra một nguồn tài liệu phong phú nhưng nó cũng gây ra một cuộc tranh luận về quyền sở hữu các hình ảnh do AI tạo ra, cũng như hàng loạt vụ kiện do các nghệ sĩ và nhà sản xuất hình ảnh bất mãn đệ trình.
Để tránh những tình huống khó xử về mặt đạo đức này, OpenAI đang thực hiện mọi thứ hơi khác một chút với DALL-E 3. Trình tạo chuyển văn bản thành hình ảnh sẽ từ chối các yêu cầu yêu cầu họ cung cấp hình ảnh được tạo theo phong cách của các nghệ sĩ sống. Công cụ này cũng cho phép người sáng tạo chọn không tham gia đào tạo mô hình hình ảnh trong tương lai của họ.
Những nỗ lực của OpenAI rõ ràng đánh dấu một bước đi đúng hướng, đặc biệt đối với những người sáng tạo muốn xóa vĩnh viễn tác phẩm nghệ thuật của họ khỏi bộ đào tạo DALL-E. Tuy nhiên, đối với những người tin rằng tác phẩm nghệ thuật của họ đã bị đánh cắp thông qua các hoạt động hack xâm lấn của OpenAI, những mod này không làm giảm bớt mối lo ngại của họ, #allfreevn chia sẻ.