نموذج ميثوس من أنثروبيك

أنثروبيك:

In a post on our Frontier Red Team blog, we provide technical details for a subset of these vulnerabilities that have already been patched and, in some cases, the ways that Mythos Preview found to exploit them. It was able to identify nearly all of these vulnerabilities—and develop many related exploits—entirely autonomously, without any human steering. The following are three examples:

  • Mythos Preview found a 27-year-old vulnerability in OpenBSD—which has a reputation as one of the most security-hardened operating systems in the world and is used to run firewalls and other critical infrastructure. The vulnerability allowed an attacker to remotely crash any machine running the operating system just by connecting to it;
  • It also discovered a 16-year-old vulnerability in FFmpeg—which is used by innumerable pieces of software to encode and decode video—in a line of code that automated testing tools had hit five million times without ever catching the problem;
  • The model autonomously found and chained together several vulnerabilities in the Linux kernel—the software that runs most of the world’s servers—to allow an attacker to escalate from ordinary user access to complete control of the machine.

يتمحور النقاش بين الباحثين والخبراء خلال الـ24 ساعة الماضية حول سؤال جوهري: هل نحن أمام مجرد حملة تهويل1 وتسويق، أم حقيقة جديدة علينا الاستعداد لها؟

بعد تجربتي المطولة لأداة Claude Code داخل الطرفية على حاسوبي، وتحديداً مع نموذج Opus 4.6، لا أستبعد إطلاقاً قدرتهم على تطوير نموذج بقوة ميثوس في مجال الأمن السيبراني.

على أية حال، لعل الوقت الآن أصبح مناسباً للقيام بتنظيف صيفي لملفاتك الحساسة وإزالتها من أي تخزين سحابي؛ فإذا تمكن قراصنة القبعات السوداء من وضع أيديهم على نموذج بهذه القدرات الفائقة، فإن أول ضحاياهم سيكونون الأشخاص الذين لا يجيدون تأمين حساباتهم الرقمية بالشكل الصحيح.

نعم، أنثروبيك لم تُطلق ميثوس للعموم حتى الآن، وحصرت الوصول إليه لشركات التقنية الكبرى التي تمس حياة الأفراد مثل مايكروسوفت، آبل، وسيسكو وغيرها لتمنحهم فرصة سد هذه الثغرات الأمنية أولاً قبل التفكير في إصداره للجميع.. إلا أن الفكرة بحد ذاتها ما زالت مرعبة!


  1. رغم توصل أنثروبيك لثغرات أمنية خطيرة في مشروع FFmpeg مفتوح المصدر والذي يشغل حرفياً كل فيديو تشاهده اليوم على الإنترنت، إلا أن القائمين على المشروع نفوا أن تكون الأكواد الإصلاحية التي وصلتهم من أنثروبيك قد كُتبت بواسطة نموذج ذكاء اصطناعي، مؤكدين أنها نتاج مجهود بشري، وتقدموا بالشكر للشركة قبل إعلانهم هذا↩︎

آبل تكشف حدود الذكاء الاصطناعي: تمثيل لا تفكير

بينما كنا نظن أن آبل بأكملها منشغلة في ترقيع Siri ليكون قابلاً للاستخدام البشري في 2025، يبدو أن موضوع الذكاء الاصطناعي داخل أروقة الشركة العملاقة أعقد من ذلك بكثير!

يذكر Matthias Bastian في مقالة تختصر الاستنتاجات من ورقة بيضاء نشرها باحثو آبل، مفادها أن نماذج الذكاء الاصطناعي التي سببت ضجة خلال الفترة الماضية توهِمك بأنها تفكر وتمنطق، بينما هي في الواقع مجرد محاكاة وتمثيلية بمستوى عالي. وبعد اختبارهم لها مع مسائل معقدة بحق، فشلت جميعها:

But at the highest complexity, all of them failed. Their reasoning processes stopped producing correct answers altogether—a breakdown previously described as underthinking. Even when the solution steps were provided, the models’ execution still collapsed once the problem got big enough.

لنسلِّم جدلًا بصرامة معايير آبل وبدقة تشخيصهم؛ مع ذلك، ما زلت أعتقد أن ما نملكه اليوم من نماذج ذكاء اصطناعي حديثة قادرة على أداء مهام بسيطة ومتوسطة التعقيد بشكل عملي ومفيد، وتختصر أيامًا من العمل إلى دقائق! فلا يوجد تبرير منطقي اليوم لتأخر آبل في تقديم الذكاء الاصطناعي بصورة متميزة على أجهزتها حتى هذه اللحظة.

هناك كثير من النقاش على تويتر وغيره حول هذه الورقة، لكن لعلها صفعة علمية لنا جميعًا بأن ما نراه ثوريًّا اليوم ليس إلا مصحح نصوص بمحرك 12 سلندر، وقد يكون مجرد بدايات البداية للذكاء الاصطناعي. ولن نصل إلى ما يسمى بالذكاء الاصطناعي العام (AGI) الذي سيستبدل البشر في أي وقت قريب.

عودة العناصر ثلاثية الأبعاد أو موت بطيء للتصميم المسطح؟

المصمم الدينماركي Michael Flarup بمقال رائع –بعد إطلاق Brian Chesky تحديث واجهة Airbnb الجديدة– عن عودة تصميم الواجهات بشكل مرح والبعد قليلاً عن التصميم المسطح للواجهات وذلك بمجاملتها بعناصر ثلاثية الأبعاد؛ أو كما يسميه بالـDiamorph:

If skeuomorphic design is performative, and flat design is reductive, maybe Diamorph is something else entirely—less about illusion, more about belonging.

الكثير منا ينسى بأن ثورة التصميم المسطح لواجهات البرمجيات1، مكنت عدداً لا يعد ولا يحصى من التقرب والتعلم على تصميم الواجهات الذي كان يتطلب حرفية عالية جداً لتسليم شيء مميز للمطورين لبرمجته؛ بساطة متناهية بلا ظل وبلا روح ثلاثية الأبعاد… كل ما كانت الواجهة متناهية البساطة، كل ما ممكنة التطبيق –وبالطبع الشركة خلفه– من التشعب بالمميزات ومختلف الشاشات بشكل أسرع ولكن ضريبتها نسبة أعلى من فقدان الروح والمرح في التجربة لدى المستخدمين2.


  1. لا يمكن أنسى هذه المقالة التي كتبتها قبل 12 سنة حين بدأت هذه الثورة في تصميم واجهات المستخدم. ↩︎

  2. بالطبع هذا لا ينطبق على كل من اتبع التصميم المسطح، فالمصممون المتميزون استطاعوا إجاد حبكات جمالية ومرحه وعلى سبيل المثال iOS اليوم، بعد سنوات من القبح. ↩︎

بودكاست واحد واثنين 07: عن تخمة التطبيقات

نعتذر عن عدم تسجيلنا للحلقة السابعة من واحد واثنين الأسبوع الماضي وذلك بسبب ظروف السفر وأمور أخرى خارجه عن إرادتنا، لكن عدنا والعود حميد، كما يقولون.

في هذه الحلقة نتحدث ونناقش تخمة التطبيقات والتطبيقات التي ننزلها على هواتفنا الذكية ولا نستخدمها وعن فكرة استخدام الهاتف الذكي بدون اي تطبيقات طرف ثالث، فقط التطبيقات الافتراضية التي أتى الهاتف الذكي بها بشكل افتراضي، هل هي ممكنة او لا؟

بودكاست واحد واثنين 04: التلفزيون والإنترنت والناس

الحلقة الرابعة من البودكاست والتي تحدثنا فيها بشكل عام عن طباع مشاهدة التلفزيون لدينا وخدمات بث المحتوى المرئي المتنوعة:

تغيرت عادات مشاهدة التلفزيون والبرامج عموماً كثيراً في عصر الإنترنت. لكن، وفي السنوات الأخيرة تحديداً، تغيرت هذه العادات بشكل جذري مع الإنترنت السريع والتوسع الكبير لخدمات الفيديو على الإنترنت مثل يوتيوب ونتفلكس وغيرها. في نفس الوقت، بدأت الكثير من هذه الخدمات بالتحول مؤخراً لنموذج الاشتراك الشهري مع الإعلان عن YouTube RED وتتزايد خدمات الاشتراك هذه بشكل واسع. كيف يؤثر هذا على عادات المشاهدة أمام شركات الكيبل عموماً؟ ماهو مستقبل المنطقة العربية أيضاً مع انتشار نسخ محلية مثل إشاعات توسع نتفلكس للمنطقة العربية والإعلان عن Starz Play؟

الآيباد برو الجديد هو أكبر برهان لتجدد دماء مايكروسوفت

خبير ومحلل مايكروسوفت الأشهر، Tom Warren بمقالة تحليلية تثبت ان مايكروسوفت قد تجددت بقيادة الرئيس التنفيذي الجديد Satya Nadella وانه لا يوجد دليل أفضل من ذلك، سوى الآيباد برو الجديد الذي أعلنت عنه آبل، قبل أمس:

Back in the ‘90s, Microsoft and Apple were fierce rivals. As the shape of computing was being formed, Bill Gates’ Microsoft was victorious with PCs. Even in 2015, Microsoft still controls over 90 percent of all laptop and desktop computing. Mac vs. PC commercials and jabs from Steve Jobs were once regular occurrences, but if you want evidence that the two have moved on then look no further than yesterday’s Apple keynote.

يستطرد Tom في المقالة متحدثاً عن مايكروسوفت الأمس، التي كانت بقيادة ستيف بالمر:

Back in the days of Steve Ballmer it’s hard to imagine this ever happening. Ballmer would have probably laughed at the iPad Pro, blind to the benefits it could bring to Microsoft as a software and services company, instead of just a Windows, Windows, Windows company. Microsoft’s new CEO Satya Nadella has formed new partnerships with Dropbox, acquired important software like Acompli, and extinguished a bitter war with Salesforce. He isn’t blind to the benefits of collaboration, and this new approach will only benefit Microsoft’s Office dominance.

باستطاعتي اقتباس كامل المقالة، بأسطرها وحروفها؛ فعلاً تعكس ماهية مايكروسوفت اليوم.

عليك قراءتها.

الاعتماد على Uber بالكامل بدلاً عن امتلاك سيارة خاصة

Megan Quinn تكتب على Medium عن تجربتها بشكل مختصر عن انتقالها للندن، بعد بيع سيارتها الخاصة في أمريكا والاعتماد بشكل كامل بعدها على خدمة Uber للأجرة وكمية المال التي تمكنت من توفيره، عندما قامت ببعض الحسابات والمقارنات بين تكاليف السيارة الخاصة وتكاليف Uber على مدى عام كامل:

Apartment Parking Space: /month x 12 months = [1]

Gas: 23 gallons x /gallon = x 52 weeks = [2]

Insurance: x 12 months = [3]

That’s /year right there for just the basics, not factoring in normal servicing, repairs, car washes, other parking, tolls or tickets (and there were tickets). And of course, that’s not including the amortized cost for the purchase of the car in the first place. It’s just the bare annual minimum.

This also doesn’t include the additional Uber, taxi or public transportation fares I had throughout the year when I wasn’t driving — for example, after drinks or when traveling in other cities.

على الرغم من ان حساباتها هذه لا تنطبق وليست بالقريبة من تكاليف امتلاك سيارة خاصة في دول الخليج وربما العالم العربي على نطاق أوسع، الا انها مثيرة للاهتمام وتستحق القراءة.

مجرد موقف لسيارتك في ولاية سان فرانسيسكو قد يكلفك ما يقارب إيجار شهري لشقة صغيرة في مدينة الرياض!

نوعان من الناس

مدونة تمبلر ظريفة وقعت عليها هذا الصباح أثناء تصفحي لتويتر.

تستعرض بشكل شبه يومي تصاميم مختلفة، لنوعان من الناس في استخداماتهم للأشياء.

التشتت عن الكتابة

Kevin Wild:

“I’m going to write,” my mind would say if it had an external voice.

I load up my iMac, launch my favorite text editor (Byword) and I start typing away.

“Music! I forgot music. Feels strange to write without music,” my mind says once more.

I load up iTunes and start playing some music. I notice I have unread tweets so I switch to Tweetbot. I wonder if there are any good vinyls on Amazon right now and decide to take a look.

I kid you not, this is how my mind works. Before I know it I’ve completely given up on writing and find myself lost browsing the Internet, wondering what I was doing in the first place.

يومي على الحاسب، ببساطة.

من الصعب الحفاظ على التركيز والكتابة عند ما تستخدم الحاسب ذو النوافذ مقارنة بالآيفون على سبيل المثال، على الأقل هذا ما يعتقده Kevin في مقالته هذه.