CountGD
CountGD là một ứng dụng AI cho phép bạn đếm các đối tượng trong hình ảnh một cách chính xác và linh hoạt bằng nhiều phương thức khác nhau, bao gồm mô tả văn bản, ví dụ trực quan, hoặc kết hợp cả hai.
CountGD là một ứng dụng AI cho phép bạn đếm các đối tượng trong hình ảnh một cách chính xác và linh hoạt bằng nhiều phương thức khác nhau, bao gồm mô tả văn bản, ví dụ trực quan, hoặc kết hợp cả hai.
Flash-VStream là một mô hình AI đột phá được thiết kế để hiểu và xử lý các luồng video dài theo thời gian thực. Không chỉ phân tích nội dung video, Flash-VStream còn có khả năng trả lời các câu hỏi liên quan đến nội dung video một cách nhanh chóng và chính xác.
LightSpeed là một công cụ chuyển đổi văn bản thành giọng nói (TTS) tiên tiến, sử dụng trí tuệ nhân tạo (AI) để tạo ra giọng đọc tiếng Việt nam tự nhiên và chân thực.
Ứng dụng Controllable Text-to-Speech (TTS) cho phép bạn chuyển đổi văn bản thành giọng nói với hơn 7000 ngôn ngữ được hỗ trợ. Đặc biệt, bạn có thể tùy chỉnh giọng nói tạo ra theo nhiều khía cạnh khác nhau.
Applio là một ứng dụng mạnh mẽ, cho phép bạn nhân bản giọng nói và tạo ra các file âm thanh với chất lượng cao, dựa trên mô hình trí tuệ nhân tạo. Giao diện thân thiện và các tính năng tùy chỉnh đa dạng giúp bạn dễ dàng tạo ra các bản sao giọng nói chân thực và sáng tạo.
ProtoGen X3.4 là một mô hình AI mạnh mẽ, biến đổi văn bản (text) thành hình ảnh chất lượng cao với phong cách nghệ thuật độc đáo.
HiDiffusion SDXL là mô hình AI tiên tiến cho phép tạo ra các hình ảnh có độ phân giải cao và chi tiết hơn từ ảnh gốc, hoặc tạo ảnh hoàn toàn mới dựa trên mô tả bằng văn bản của bạn. Nó kết hợp sức mạnh của HiDiffusion và ControlNet để tăng cường khả năng sáng tạo và kiểm soát hình ảnh.
RVC⚡ZERO cho phép bạn tạo ra giọng nói tự nhiên và biểu cảm từ văn bản, với khả năng tùy chỉnh cao để phù hợp với nhu cầu của bạn.
AI Photo Restoration là một công cụ trực tuyến miễn phí, sử dụng trí tuệ nhân tạo (AI) để phục hồi và sửa chữa những bức ảnh cũ, hư hỏng và trầy xước của bạn. Chỉ với vài thao tác đơn giản, bạn có thể mang lại vẻ đẹp tươi mới cho những kỷ niệm quý giá của mình.
Audio🔹separator là một công cụ AI ấn tượng sử dụng mô hình MDX-Net để tách giọng hát (vocal) và nhạc nền (background) từ một tệp âm thanh.
ControlNet++ là một phiên bản cải tiến của ControlNet, cho phép bạn tạo ảnh bằng AI với khả năng kiểm soát tốt hơn dựa trên các điều kiện đầu vào như đường viền, chiều sâu, phân vùng,...
Midi Composer là một công cụ thú vị cho phép bạn tạo ra âm nhạc mới bằng cách sử dụng trí tuệ nhân tạo (AI) để chuyển đổi và biến đổi các sự kiện MIDI.
Bạn muốn truy vấn thông tin từ các tệp PDF mà không cần phải đọc toàn bộ tài liệu? PDF-based chatbot chính là giải pháp dành cho bạn! Công cụ này sử dụng trí tuệ nhân tạo (AI) để đọc và hiểu nội dung tài liệu, sau đó trả lời câu hỏi của bạn dựa trên thông tin đó.
Pictures of MIDI là một mô hình AI đột phá cho phép bạn biến những bản vẽ đơn giản thành các bản nhạc piano đầy sáng tạo. Mô hình này sử dụng kỹ thuật inpainting (vẽ đè lên ảnh) dựa trên khuếch tán (diffusion-based inpainting) để tạo ra các nốt nhạc từ những vùng trắng trong hình ảnh.
Consistent Character Workflow là một công cụ AI giúp bạn tạo ra nhiều hình ảnh của cùng một nhân vật trong các tư thế khác nhau.
Whisper JAX là một phiên bản tối ưu hóa của mô hình Whisper do OpenAI phát triển, được sử dụng để chuyển đổi giọng nói thành văn bản.
UVR5 UI là một công cụ sử dụng AI để tách nhạc và giọng hát (vocal) từ các bài hát.
Paints-Undo là một công cụ AI cho phép bạn "tua ngược" quá trình vẽ của một bức tranh kỹ thuật số.
AudioLDM là một mô hình AI mạnh mẽ cho phép bạn tạo ra các đoạn âm thanh đa dạng như lời nói, âm nhạc, hiệu ứng âm thanh, và nhiều hơn nữa, chỉ bằng cách nhập vào một mô tả bằng văn bản
LookSwap là một công cụ đột phá của FASHN AI, sử dụng trí tuệ nhân tạo (AI) để bạn có thể "thử" các trang phục khác nhau trên người mẫu trong ảnh.
SadTalker là công cụ AI giúp tạo video chân thực từ một ảnh tĩnh và một đoạn âm thanh. Công cụ này sử dụng mô hình 3D để mô phỏng chuyển động khuôn mặt và đồng bộ hóa môi của nhân vật với âm thanh đầu vào.
Outfit Anyone là một công cụ AI sáng tạo cho phép bạn thử đồ ảo trên người mẫu với bất kỳ trang phục nào bạn muốn.
PuLID cho phép bạn tạo ra những hình ảnh cá nhân hóa độc đáo từ một ảnh gốc và mô tả văn bản
Screenshot2HTML là một công cụ AI mạnh mẽ cho phép bạn chuyển đổi ảnh chụp màn hình thành mã HTML có thể chỉnh sửa.
SUPIR là một mô hình AI đột phá, sử dụng để nâng cấp và khôi phục ảnh chất lượng cao với khả năng phóng đại lên tới 10 lần.
OOTDiffusion là một mô hình AI chuyên biệt trong việc tạo ra hình ảnh trang phục thời trang đa dạng, phong phú và chi tiết. Với khả năng tùy biến cao, bạn có thể thỏa sức sáng tạo những bộ trang phục độc đáo, từ áo quần hàng ngày cho đến các thiết kế dạ hội lộng lẫy.
IP-Adapter-FaceID Plus là một công cụ AI mạnh mẽ, cho phép bạn tạo ra những bức ảnh chân thực hoặc mang phong cách nghệ thuật với khuôn mặt của chính bạn hoặc người khác, chỉ bằng một vài thao tác đơn giản.
PixArt-Sigma là một hệ thống chuyển đổi văn bản thành hình ảnh mạnh mẽ, sử dụng kiến trúc Transformer và được huấn luyện trên bộ dữ liệu văn bản khổng lồ từ T5.
VBRT là một công cụ mạnh mẽ sử dụng trí tuệ nhân tạo (AI) để loại bỏ nền khỏi video một cách tự động
Kolors là một mô hình AI chuyển đổi văn bản thành hình ảnh (text-to-image) mạnh mẽ, được phát triển bởi Kwai-Kolors.
IC-Light là một công cụ trực tuyến mạnh mẽ sử dụng trí tuệ nhân tạo (AI) để thay đổi ánh sáng trong ảnh chân dung, mang lại sự linh hoạt và sáng tạo cho bức ảnh của bạn.
AICoverGen là một công cụ trực tuyến miễn phí, cho phép bạn chuyển đổi giọng hát trong các bài hát thành giọng của các mô hình AI đã được huấn luyện
SoniTranslate là ứng dụng web mạnh mẽ giúp dịch và lồng tiếng video dễ dàng
InstantStyle giúp bạn dễ dàng chuyển đổi phong cách của một hình ảnh mà không làm mất đi nội dung ban đầu.
InstantMesh là một công cụ đột phá sử dụng trí tuệ nhân tạo (AI) để chuyển đổi hình ảnh 2D thành mô hình 3D chỉ trong vài phút
PhotoMaker là một công cụ đột phá cho phép bạn tạo ra những bức ảnh chân thực và tùy chỉnh cao chỉ bằng một vài bước đơn giản
Ilaria RVC là một công cụ cho phép bạn biến đổi giọng nói của mình hoặc giọng nói trong file âm thanh thành giọng nói của các nhân vật khác nhau
VLM Captioner + Prompt Enhancer + SD3 Image Generator là một công cụ mạnh mẽ để tạo ra những hình ảnh AI chất lượng cao.
DALLE 4K là một mô hình AI đột phá của OpenAI, cho phép bạn tạo ra những hình ảnh tuyệt đẹp và chi tiết với độ phân giải lên tới 4K chỉ bằng cách sử dụng ngôn ngữ tự nhiên.
LivePortrait là một mô hình AI đột phá, cho phép tạo video chân thực từ ảnh tĩnh để chuyển động khuôn mặt, biểu cảm và chuyển động đầu của người trong ảnh một cách tự nhiên và mượt mà
Omni Zero là một công cụ AI mạnh mẽ cho phép bạn tạo ra những bức chân dung theo phong cách nghệ thuật đa dạng mà không cần bất kỳ kỹ năng chuyên môn nào
Animagine XL 3.1 là một mô hình AI mạnh mẽ chuyên về tạo hình anime từ các mô tả văn bản (prompt).
Gemma 2 là mô hình ngôn ngữ lớn (LLM) thế hệ mới nhất của Google, được xây dựng trên kiến trúc Transformer, nổi tiếng với khả năng xử lý ngôn ngữ tự nhiên ấn tượng.
IDM-VTON là một công cụ đột phá sử dụng trí tuệ nhân tạo (AI) để mang đến trải nghiệm thử đồ ảo vô cùng chân thực.
FoleyCrafter là một công cụ AI tuyệt vời, chuyên tạo hiệu ứng âm thanh (Foley) tự động cho video của bạn
FlashSD3 là một phiên bản cải tiến của mô hình Stable Diffusion 3, được thiết kế để tạo ra hình ảnh chất lượng cao với tốc độ đáng kinh ngạc.
ToonCrafter là một phương pháp sáng tạo mới, vượt qua giới hạn của các kỹ thuật nội suy video hoạt hình truyền thống dựa trên sự tương ứng (correspondence-based)
4M là một framework AI có thể dự đoán hoặc tạo ra bất kỳ loại dữ liệu nào (chẳng hạn như văn bản, hình ảnh, âm thanh,...) từ bất kỳ tập hợp các loại dữ liệu khác.
Florence-2 là một mô hình AI đột phá của Microsoft, kết hợp hiểu biết về cả hình ảnh và ngôn ngữ tự nhiên để thực hiện đa dạng các tác vụ liên quan đến thị giác máy tính (computer vision) và ngôn ngữ thị giác (vision-language)
DiffIR2VR là một công cụ đột phá cho phép bạn cải thiện chất lượng video mà không cần phải đào tạo lại mô hình AI cho từng tác vụ cụ thể. T
ExVideo 4K là một công nghệ đột phá, sử dụng trí tuệ nhân tạo (AI) để cải thiện đáng kể chất lượng của video được tạo ra bởi các mô hình như Stable Video Diffusion
IMAGINEO 4K sử dụng sức mạnh của mô hình Stable Diffusion để biến những mô tả văn bản của bạn thành những tác phẩm nghệ thuật 4K tuyệt đẹp
Stable Diffusion 3 là một mô hình AI mạnh mẽ cho phép bạn tạo ra những hình ảnh tuyệt đẹp và độc đáo chỉ bằng cách nhập vào một mô tả bằng văn bản.
ChatGPT 4o là một không gian AI đa năng cho phép bạn tương tác với mô hình GPT-4o thông qua văn bản, hình ảnh, âm thanh và webcam. Bạn có thể tạo video, tạo hình ảnh và trò chuyện với AI một cách nhanh chóng và dễ dàng.
Chia sẻ kiến thức và thông tin về các ứng dụng AI tốt nhất hiện nay