فك عقدة الأسباب والنتائج يكون تارة صعباً جداً. ماذا نفعل حتى لا نخلط بين أطراف الخيط ونتجنب استنتاجات خاطئة.
تصوروا بلدة صغيرة تقع على سهل. كل يوم تدور فيها طواحين الهواء أما الريح فتذر الغبار في عيون سكانها. يستمر هذا فترة، أي الطواحين تدور والريح تهب. في نهاية الأمر يمل سكان البلدة من الغبار الذي يؤذي أعينهم فيهدمون كل الطواحين طبقاً لمنطقهم.
من السهل ملاحظة خطأ هؤلاء السكان الأغبياء وهو أن الريح هي التي تدير الطواحين وليس العكس.
ولكن ثمة أمثلة كثيرة ليست بهذا الوضوح في العالم الواقعي حيث يصعب التفريق بين علاقة السبب والنتيجة وعوامل الارتباط. في أحد الأبحاث التي أجريت عام 1999 تم استنتاج أنه إذا كان طفل ما ينام بمصباح ليلي خافت الضوء فهذا سيؤدي إلى قصر نظره، ومؤخراً تم دحض هذا الاستنتاج وذلك لأن قصر النظر هو نتيجة عوامل وراثية، وإذا كان الوالدان قصيرا النظر كانا يضطران إلى إشعال أنوار ليلية خافتة في غرف أولادهم.
كما ويوجد مثال يتعلق بالكولسترول ذات البروتينات الدهنية عالية الكثافة. هذا الكولسترول "الجيد" يخفف من أمراض القلب، لكن الأدوية ضد أمراض القلب التي تزيد من كمية الكولسترول ذات البروتينات الدهنية عالية الكثافة في الدم لا تأتي بنتائج مرغوبة، لماذا؟ تبين أن هذا الكولسترول ولو أنه منتج جانبي من عمل القلب السليم إلا أنه لا يدافع عنه.
تتصادف عوامل الارتباطات كثيراً جداً وهي لا تسمح بالتوصل إلى استنتاجات موثوقة بها كما أنها ليست ثابتة. كما أن علاقة السبب والنتيجة متينة وموثوقة وتشكل فيما بينهما سلاسل مقنعة تعودنا استخدامها عند تفكيرنا في طبيعة الأشياء.
من السهل جداً إيجاد عوامل الارتباط، ثمة مشروع بعنوان Spurious Correlations يتم ضمنه البحث التلقائي عن عوامل الارتباط مهما كانت عديمة المعنى بالمعطيات المتاحة للجمهور.
أما الكشف عن علاقات السبب والنتيجة فمسألة في غاية التعقيد. منذ فترة تم إجراء بحث جديد حيث وردت الطرق المخصصة لهذا بالذات. أساس الطريقة التي عرضها مؤلف العمل الأستاذ يوريس موويي وزملاؤه من جامعة أمستردام بسيطة جداً: إذا كان حدث ما يؤثر على الثاني فإن التغيرات العشوائية للحدث الأولي ستنعكس في الحدث اللاحق.
مثلاً لنفرض أننا نريد أن نجد العلاقة بين كثافة حركة السير على طريق سريع والوقت الذي يحتاجه عادل كي يصل إلى مكان عمله. لكن الفترة التي قضاها هو في الطريق وكثافة حركة السير يتغيران دون أي ارتباط فيما بينهما، لأن في بعض الأحيان قد يقف عادل على الإشارة الحمراء بمجرد إنعطافه خلف الزاوية فيفقد خمس دقائق، أما في المرة القادمة قد يكون بطء الحركة من جراء الجليد على الطرقات.
لكن الفكرة الرئيسية هي أن التقلبات العشوائية لكثافة حركة السير ستؤثر على الوقت الذي سيقضيه عادل في الطريق في حين أن التقلبات العشوائية للوقت المنقضي لا تؤثر على المرور. بعد تحديد حصة تأثير تقلبات كثافة حركة السير على الوقت الذي قضاه عادل في الطريق نستطيع القول أن حركة المرور هي التي تؤثر على الوقت الذي يقضيه عادل في الطريق وليس العكس.
ومع ذلك فهذه الطريقة ليست حلاً شاملاً، فهي كسائر الطرائق لا تعمل في كافة الأحوال دون استثناء وتنفع للكشف فقط عن أسهل علاقات السبب والنتيجة. ففي الحالة ثلاثية الأحداث مثلاً عند تحديد عامل الارتباط بين استهلاك البوظة (الآيس كريم) وغرق الذين يسبحون في الماء (والعامل المشترك بين هذين الحدثين هو الجو الحار) هذه الطريقة لن تأتي بنتيجة.
ورغم ذلك فالعمل المقدم هو خطوة هامة إلى الأمام في مجال الإحصائيات التي غالباً ما تكون غامضة، وهذه الحجة أو السبب هي أشياء أيجابية.