علي بابا تُطلق Qwen-Image-Edit: نموذج مفتوح المصدر بـ 20 مليار دولار لتحرير الصور والنصوص المتقدمة
في سطور أطلق فريق Qwen التابع لشركة Alibaba Cloud برنامج Qwen-Image-Edit، وهو نموذج متطور لتحرير الصور يجمع بين التحرير الدلالي والمظهري مع تعديل نص ثنائي اللغة بدقة، مما يوفر إمكانيات متقدمة للتطبيقات الإبداعية والعملية.
علي بابا سحابة كوين قدم الفريق Qwen-Image-Edit، وهو نموذج متقدم لتحرير الصور مشتق من إطار عمل Qwen-Image 20B. يُوسّع النظام الجديد قدرات Qwen-Image المتميزة في عرض النصوص من خلال تطبيقها على تحرير الصور، مع التركيز بشكل خاص على دقة تعديلات النصوص. يُعالج Qwen-Image-Edit الصور المُدخلة من خلال مكونين متوازيين: Qwen2.5-VL، الذي يُدير التحكم الدلالي البصري، وVAE Encoder، الذي يُدير المظهر المرئي. يُمكّن هذا النهج المزدوج النموذج من التعامل بفعالية مع مهام التحرير على مستوى الدلالة والمظهر. يُمكن الوصول إلى الأداة عبر Qwen Chat ضمن ميزة "تحرير الصور".
صُمم Qwen-Image-Edit ليعمل على نطاقات تحرير متعددة. فهو يدعم تعديلات على مستوى المظهر، كإضافة أو إزالة أو تعديل العناصر المرئية مع الحفاظ على سلامة جميع أجزاء الصورة الأخرى، بالإضافة إلى تعديلات على المستوى الدلالي، كإنشاء الملكية الفكرية، وتدوير الكائنات، ونقل الأنماط، حيث يُسمح بتعديلات أوسع للبكسل مع الحفاظ على سلامة الدلالات. كما يوفر إمكانيات تحرير نصوص متطورة باللغتين الصينية والإنجليزية، مما يسمح للمستخدمين بإضافة أو إزالة أو تعديل النصوص داخل الصور مع الحفاظ على تناسق الخط والحجم والنمط. تشير اختبارات المقارنة عبر العديد من قواعد البيانات المعروفة على نطاق واسع إلى أن Qwen-Image-Edit يحقق أداءً متطورًا في تحرير الصور، مما يجعله نموذجًا أساسيًا قويًا للتطبيقات المستقبلية في هذا المجال.
تحرير Qwen-Image-Edit الدلالي والمظهري للتطبيقات الإبداعية والعملية
واحد من defiمن أهم مزايا Qwen-Image-Edit هي وظائفه المتقدمة في التحرير الدلالي والمظهري. يتضمن التحرير الدلالي تعديل محتوى الصورة مع ضمان بقاء المعنى البصري الأساسي سليمًا. ولتوضيح هذه الوظيفة بشكل مباشر، يُسلط فريق التطوير الضوء على استخدامها مع كوين تميمة المملكة المتحدة الرسمية، الكابيبارا، كمثال عملي.
تُظهر الملاحظة أنه على الرغم من اختلاف غالبية وحدات البكسل في الصورة المُعدَّلة عن تلك الموجودة في صورة الإدخال الأصلية على اليسار، إلا أن الاتساق العام لشخصية الكابيبارا ظلّ محافظًا على كامل اتساقه. يُظهر هذا قدرة Qwen-Image-Edit القوية على التحرير الدلالي، والتي تدعم التطوير المرن والمتنوع لمحتوى الملكية الفكرية الأصلي. بالإضافة إلى ذلك، ضمن تطبيق Qwen Chat، تم إنشاء مجموعة مُخصصة من مُطالبات التحرير حول أنواع الشخصيات الستة عشر من مؤشر مايرز بريجز للأنماط الشخصية. باستخدام هذه المُطالبات، تم إنتاج مجموعة كاملة من حزم الرموز التعبيرية ذات الطابع الخاص بمؤشر مايرز بريجز للأنماط الشخصية، والتي تُظهر تميمة الكابيبارا، مما وسّع نطاق تمثيل الشخصية ووضوحها بشكل فعال.
علاوة على ذلك، يُمثل تركيب المنظر الجديد استخدامًا مهمًا آخر في مجال التحرير الدلالي. يستطيع برنامج Qwen-Image-Edit تدوير الكائنات بزاوية 90 درجة أو تنفيذ دوران كامل بزاوية 180 درجة، مما يُتيح التصور المباشر للجانب الخلفي للكائن. ومن الأمثلة الأخرى على التحرير الدلالي نقل الأسلوب، حيث يُمكن، على سبيل المثال، إعادة تفسير صورة شخصية قياسية إلى جماليات فنية متعددة، بما في ذلك أساليب تُذكرنا باستديو جيبلي.
إلى جانب التحرير الدلالي، يُعدّ تحرير المظهر وظيفةً مطلوبةً بكثرة في تعديل الصور. يُركّز هذا النهج على الحفاظ على مناطق مُحدّدة من الصورة دون تغييرٍ يُذكر أثناء إضافة عناصر مُحدّدة أو إزالتها أو تعديلها. وكما هو مُوضّح في مثالٍ لدمج لافتةٍ بسلاسةٍ في مشهدٍ ما، فإنّ تحرير المظهر يُناسب مجموعةً واسعةً من التطبيقات، مثل تعديلات الخلفية للأفراد أو تعديلات الملابس. defiالميزة الرئيسية لبرنامج Qwen-Image-Edit هي دقته في تحرير النصوص، وهي ميزة مستمدة من الخبرة المتقدمة التي تتمتع بها Qwen-Image في تقنيات عرض النصوص.
إخلاء المسؤولية: يعكس محتوى هذه المقالة رأي المؤلف فقط ولا يمثل المنصة بأي صفة. لا يُقصد من هذه المقالة أن تكون بمثابة مرجع لاتخاذ قرارات الاستثمار.
You may also like
CandyBomb وSAPIEN تداول العقود الآجلة لربح حصة من 150,000 SAPIEN!
بطولة نادي التداول من Bitget (المرحلة رقم 5) - اربح حصة من 80,000 BGB، حتى 800 BGB لكل مستخدم!
بطولة نادي التداول من Bitget (المرحلة رقم 5) - اربح حصة من 80,000 BGB، حتى 800 BGB لكل مستخدم!
تحدي Bitget Onchain (المرحلة 15) - تداول واربح حصة من التوزيعات المجانية بقيمة 100,000 BGB
Trending news
المزيدأسعار العملات المشفرة
المزيد








