عندما البيانات الضخمة بيانات سيئة

لم يقل أحد أن هذا سيكون سهلا.

الدراسة

سوسيال إنتيربريس؛ لينكيدين تكشف النقاب عن منصة جديدة للتدوين؛ تحليلات البيانات الكبيرة؛ هل هذا هو عصر أولاب كبيرة؟؛ تحليلات البيانات الكبيرة؛ يهدف داتاروبوت لأتمتة الفاكهة منخفضة شنقا من علوم البيانات؛ تحليلات البيانات الكبيرة؛ مؤسس مابر جون شرودر يتنحى، كو ليحل محل

كنت قد سمعت من آلات التصوير بالرنين المغناطيسي للتصوير التشخيصي: آلات كبيرة حيث ينزلق الموضوع في وسط آلة صاخبة على شكل دونات في حين أن مجال مغناطيسي قوي وموجات الراديو خلق صورة من الدواخل الخاصة بهم.

هناك العديد من أنواع التصوير بالرنين المغناطيسي. التصوير بالرنين المغناطيسي الوظيفي (فمري) ينظر في كيفية استجابة أجزاء مختلفة من الدماغ للمؤثرات. استخدام الرنين المغناطيسي الوظيفي شيوعا هو لمرض الزهايمر العصبية التصوير. وقد استخدمت حوالي 40،000 ورقة نشرت الرنين المغناطيسي الوظيفي إلى الخوض في الدماغ البشري على مدى السنوات ال 25 الماضية.

ومع ذلك، حتى هذه الدراسة، لم يتم التحقق من حزم البرامج المستخدمة لتحليل البيانات أبدا مع البيانات الحقيقية.

في ورقة فشل الكتلة: لماذا الاستدلال الرنين المغناطيسي الوظيفي لمدى المكانية تضخمت معدلات إيجابية كاذبة قام الباحثون أندرس إكلوند وهانس نوتسون، من السويد، وتوماس E. نيكولز، من المملكة المتحدة، حوالي ثلاثة ملايين تحليل مجموعة عشوائية باستخدام الحقيقي – وليس محاكاة – البيانات البشرية لحساب معدلات إيجابية كاذبة الفعلية. وخلصوا إلى ذلك

أعطت التقنيات غير الصالحة ما يصل إلى 70 في المئة ايجابيات كاذبة. هذا سيء. كم سيئ؟

في عالم البيانات الكبيرة، يجب أن تؤخذ النوعية الإحصائية على محمل الجد. ولكن الإحصاءات معقدة، لذلك المهنيين حتى المتعلمين تعليما عاليا تعتمد على حزم جعل الافتراضات التي لا يفهمون، واثقة من أن النتائج سليمة.

وتظهر هذه الدراسة أنه في مجال واحد مهم على الأقل من البحوث الثقة في صحة الإحصائية في غير محله. تم التحقق من صحة الحزم مع البيانات الاصطناعية، ولكن

هذه ليست مجرد مشكلة في أبحاث الدماغ. في تخزين البيانات، على سبيل المثال، افترضت معدلات فقدان بيانات مصفوفة ريد طويلة المدعومة أن فشل محرك الأقراص كانت مستقلة.

استغرق الأمر أكثر من عقد من الزمان للبحث للعثور على هذا ليس صحيحا. وبطبيعة الحال، خلال هذا العقد، باعت البائعين المليارات من الدولارات قيمتها من صفائف ريد الأداء، في حين جمع البيانات الخدمة التي ينبغي أن تبين لهم الحقيقة.

ولكن كما هو الحال مع ممارسات الإقراض غير المسؤولة التي أدت إلى الركود الكبير، فإن الشركات التي تستفيد من الافتراضات غير الصالحة لا تريد أن تفسد الحزب. كما قال ويل روجرز “ليس ما لا نعرفه أن يعطينا المتاعب، وهذا ما نعرفه ليس كذلك”.

حتى أكثر صحيح مع البيانات الكبيرة.

ينكدين يكشف النقاب عن منصة جديدة للتدوين

هل هذا هو عمر أولاب الكبير؟

يهدف داتاروبوت لأتمتة الفاكهة منخفضة شنقا من علم البيانات

مؤسس مابر جون شرودر يتنحى، كو ليحل محل

تأخذ بت التخزين

Refluso Acido