יום רביעי, 1 באוקטובר 2014

מחשבים עומדים להחליף את האנושות!

לפחות, זו התכנית בכל מה שנוגע לזיהוי הצורות של גלקסיות.
אני מניח שרוב מי שקורא את הבלוג יודע שאסטרופיזיקאים נוטים להבדיל בין גלקסיות ספירליות לגלקסיות אליפטיות. ובכן, מסתבר שלא כל כך פשוט להבחין ביניהן. כלומר, לעין האנושית דווקא די קל, במרבית המקרים, אבל קשה מאוד לתרגם את האבחנה האנושית לקוד מחשב שמסוגל לבצע את האבחנה באותה רמה או יותר. וזה רק כשמדובר על האבחנה של קוסמולוגים, בין שני סוגים של גלקסיות; אסטרונומים מבחינים בין עשרות תת סוגים... מכיוון שכך, אסטרונומים נאלצים להסתמך על עיניים אנושיות כדי לסווג גלקסיות שנקלטות בטלסקופים, אך הזמן שזה לוקח הוא הרבה מעבר למה שצוות קטן של אסטרונומים יכול להתמודד איתו. בשביל להתמודד עם הבעיה הזו, והיות ובשביל לסווג גלקסיה על פי מראית עין לא צריך הכשרה מדעית ארוכה, החלו אסטרונומים בפרוייקטים של "מדע אזרחי" - פרוייקטים שבהם אנשים מן השורה מבצעים מלאכות מדעיות שאינן דורשות הרבה ידע או הכשרה, אך דורשות הרבה זמן - על מנת לסווג את הגלקסיות. כמובן שהסיווג של אדם בודד ללא ההכשרה והנסיון של אסטרונומים אינו אמין באותה מידה, אך ההגיון והנסיון מראים שכאשר מספר אנשים מסתכלים על אותה תמונה של גלקסיה וכולם מסכימים על הסיווג, ההסכמה של הסיווג עם סיווג של אסטרונומים מנוסה היא לרוב גבוהה מאוד, ובשיטה הזו עובדים ה"אזרחים המדענים". דוגמה אחת של פרויקט שכזה היא "גן החיות של הגלקסיות" (Galaxy Zoo), פרוייקט שהחל לפני כמה שנים, ובו סווגו כ300 אלף גלקסיות בשלוש השנים האחרונות (גם אתם יכולים להירשם ולסווג!).

אסטרונומים אוהבים לסווג...
(לחצו על התמונה בשביל לראות אותה בגודלה המקורי)




אך הקצב שבו טלסקופים מגלים גלקסיות חדשות גבוה בהרבה ממה שכל קבוצה של "מדענים אזרחים" יכולה להתמודד איתו, ולכן יש צורך למצוא חלופות. החלופה המתבקשת היא כמובן למצוא אלגוריתם פשוט שידע להבחין בין כל סוגי הגלקסיות, אך אנחנו לא שם. חלופה אחרת שמנסים בשנים האחרונות לפתח היא זו של למידת מכונה (machine learning). זהו תחום במדעי המחשב שמתמקד בכתיבת תוכנות שיודעות ללמוד בעצמן. לא מדובר בבינה מלאכותית של ממש, אבל התחום בהחלט מתקדם בשנים האחרונות, וישנם כל מיני הישגים מעניינים מאוד שיוצאים ממנו. הבעיה היא שעל מנת שמכונה תוכל ללמוד בצורה היעילה ביותר, היא זקוקה למדגם גדול ומדויק ככל האפשר של מהם "זיהויים חיוביים" ומהם "זיהויים שליליים"; כלומר, מה מתאים להיכנס לרשימה ומה לא. מספר הגלקסיות שסווג על ידי אסטרונומים הוא לא עד כדי כך גדול, וזה מגביל את ההתקדמות של הכיוון הזה.
ובכן, לפני מספר ימים התפרסם טקסט באתר arXiv.org שבו מספר כותבים מציגים תוצאות של מחקר שערכו ושבו לקחו מידע מסיווגים של "מדענים אזרחים" והעבירו אותו דרך קוד "מכונה לומדת" שכתבו, כך שהקוד יוכל להגיע למצב שהוא מסווג בעצמו. לטענתם, רמת הדיוק של הסיווג של הקוד שלהם גבוהה מאוד, לפחות בסוגים מסויימים של גלקסיות. אם הדברים הם אכן כפי שהם מוצגים, זה יכול לסמן נקודת מהפך, כך שבעתיד הנראה לעין כבר נוכל לסווג את כל הגלקסיות שנצפות. בעידן שבו סקרי הגלקסיות הבאים אמורים לצפות במליארדים רבים של גלקסיות, זה דבר חשוב מאוד.



דוגמה לאיך סוגים שונים של גלקסיות נראים בזמנים שונים בהתפתחות היקום. כאילו היה חסר סיבוך בסיווג הגלקסיות.

דבר נוסף שמעניין בעיני הוא שהכותבים פרסמו את הטקסט בפורמט מאוד פשוט, שלא מתאים לאף זו'רנל, ויתכן שזה רומז שהם לא מתכוונים לשלוח את המאמר לאף ז'ורנל אלא להשאיר את הבדיקה שלו לכל הקהילה שמתעניינת בנושא ושנחשפת למאמר דרך האתר arXiv.org. וזו הזדמנות מצוינת בעיני להסביר מה זה האתר הזה - מדובר באתר שאוסף טקסטים מדעיים שנשלחים אליו (בעיקר בפיזיקה, אך גם בתחומים נוספים, כמו מדעי המחשב) ומפרסם אותם לאחר מעבר בסיסי ביותר, מבלי להעביר אותם ביקורת עמיתים. עם זאת, כיום מדובר באתר שדרכו כנראה נחשפים מרבית הפיזיקאים למרבית המידע החדש בתחום, וזאת מכיוון שהאתר מרכז אליו את כל המאמרים (כולל מספר מצומצם של מאמרים ישנים, שנסרקים או מוקלדים על ידי מתנדבים, וטקסטים נוספים שאינם נשלחים לז'ורנלים) שיוצאים בפיזיקה, פחות או יותר, פעמים רבות חודשים לפני שהמאמר מתפרסם, והאתר פתוח לכל אדם מכל מקום (ז'ורנלים מדעיים מחייבים תשלום על מנת לצפות במאמרים, ועל כן לרוב מדענים יכולים לצפות בהם רק מהאוניברסיטאות, שלהן הסכמים עם הז'ורנלים). כמובן שהמידע פעמים רבות צריך להילקח בעירבון מוגבל, מכיוון שלא בהכרח כבר עבר ביקורת עמיתים רצינית, אך מכיוון שנחשפים אליו הרבה מאוד אנשים שמתעסקים בתחום קורים מקרים בהם מדען אחר שעוסק בתחום רואה בעיה במאמר ומעיר, או מנהל דיון עם כותבי המאמר, כך שעד שהמאמר מגיע לפרסום בז'ורנל הוא כבר יכול היה לעבור כל מיני תיקונים שלא בהכרח היה עובר בתהליך הפרסום בז'ורנל (שם המאמר נחשף רק לבוחן אחד או שניים, לרוב). מדובר בתופעה שחדשה יחסית במדע, ובעיני היא מרתקת. כמובן שזה לא מחליף לחלוטין את הז'ורנלים המבוססים, אבל אלו בהחלט צעדים לקראת עתיד מעניין במדע.

אין תגובות:

הוסף רשומת תגובה