מבוא למדעי הנתונים

מבוא למדעי הנתונים לכל אחד פשוט ישים ומעניין

מר איגור קליינר

3-5.7.2022

14:00 - 10:00

היום קיימת כמות אדירה של דאטה מסוגים שונים. היכולת לדבר עם דאטה היא מיומנות נחוצה וחשובה גם לחוקרים וסטודנטים וגם לאנשי תעשיה. לפי תחזיות ב-5 שנים הקרובות יהיה מחסור במדעני הנתונים.

בסדנה המשתתפים ילמדו "לדבר עם דאטה" בעזרת מערכת חדשה Orange data mining. המערכת בנויה בצורה המאפשרת לאנשים ללא ידע בתחום, להתחיל לעבוד ולחקור את הדאטה החל מהשיעור הראשון, וללא צורך בתכנות.

עיקרה של הסדנה הוא בפתרון משותף של בעיות מעניינות וחשובות תחומים שונים: ביולוגיה, משפט, ספורט, בורסה, בתי סוהר, אתרי הכרויות, אסון מעבורת החלל צ'לנג'ר. בנוסף המשתתפים יוכלו להשתמש בדאטה סטים שלהם לצורך תרגול.

הסדנה מבוססת באופן חלקי על הקורסים: מבוא למדעי הנתונים, מבוא לחקר ביצועים וחיזוי ועל קורס מערכות לומדות, הנלמדים באוניברסיטת חיפה.

קהל יעד: סגל החוקרים והסטודנטים לתואר שלישי עם מוטיבציה להיכנס לעולם המדעי הנתונים.

שימוש במחשבים: על כל משתתף להצטייד במחשב נייד עם תוכנת Orange מותקנת עליו, ולהגיע איתו לסדנא.

*הכיתה אינה מצוידת במחשבים. השימוש יהיה במחשבים האישיים.

בסוף הסדנה המשתתפים יוכלו "לדבר עם DATA", להכין DATA, לעבד DATA, לבחור מודל למידה מתאים, להעריך איכות המודל בסוף התהליך ולדעת האם ומתי צריך לפנות למדעי הנתונים.

תוכן עניינים:

  1. היכרות עם עולם מדעי הנתונים.

  2. עבודה עם תוכנת Orange.

  3. סוגים של נתונים, הצגה גרפית של נתונים ומדדים חשובים.

  4. תהליך העבודה של מדעי נתונים CRISP DM.

  5. עיבוד מקדים של נתונים.

  6. שיטות ניבוי: רגרסיה וקלסיפיקציה.

  7. קלסטרינג.

  8. בדיקת איכות של מודל.

  9. עקרונות עבודה של מדעי נתונים, טעויות ומלכודות נפוצות.

דאטה של הסדנה:

  1. חיזוי מחיר עתידי של יין מבוסס על מחקר של Orley Ashenfelter.

  2. אסון מעבורת החלל צ'לנג'ר.

  3. רפואה: Framingham study .

  4. ספורט: Moneyball.

  5. אתר הכרויות: EHarmony .

  6. גילוי סרטן.

  7. בתי סוהר.