לדף הכניסה של ישרא-בלוג
לדף הראשי של nana10
לחצו לחיפוש
חפש שם בלוג/בלוגר
חפש בכל הבלוגים
חפש בבלוג זה




מלאו כאן את כתובת האימייל
שלכם ותקבלו עדכון בכל פעם שיעודכן הבלוג שלי:

הצטרף כמנוי
בטל מנוי
שלח

RSS: לקטעים  לתגובות 
ארכיון:


5/2017

ספין - תערובת של קלאסי וקוונטי


בפוסט הקודם עסקנו בפרדוקס EPR שנועד להפריך את פרשנות קופנהגן, ובסופו אמרתי שבפעם הבאה אכתוב על משפט בל. זה גם מה שהתחלתי לעשות, אבל במהלך הכתיבה החלטתי שלפני שנגיע לזה, כדאי שנעשה עצירה בעוד תחנה קטנה אחת בדרך. כדי להבין את משפט בל, צריך להכיר גודל פיזיקלי חשוב מאוד, שמתנהג בצורה שונה לחלוטין ממה שאנחנו רגילים מגדלים פיזיקליים אחרים. על כן, החלטתי להקדיש לו פוסט הבהרה. מבטיח שבפוסט הבא הוא ייקח חלק מאוד משמעותי.

למי שמעוניין לקרוא את הפוסטים הקודמים במכניקת קוונטים - 123456. אבל למען האמת, בשביל הפוסט של היום לא יותר מדי הכרחי לקרוא אף אחד מהם. גילוי נאות - בכל הפוסטים שאני כותב אני מפשט את פני הדברים, אבל בפוסט הזה ספציפית זה מגיע לרמה קצת יותר קיצונית. ברוב הנושאים שאני כותב עליהם אני מצליח למצוא אנלוגיות שמצד אחד מפשטות את פני הדברים, אבל מצד שני שומרות על רמה סבירה של דיוק. אבל למען האמת, הפוסט הזה עוסק בנושא שנורא קשה להציג אותה בצורה פשוטה מבלי לשטח אותו (לצערי). למי שמעוניין לקרוא עליו ברמת דיוק מעט יותר גבוהה, יותר מאשמח להמליץ על חומרים.

_______________________________________________________________________

 

מה זה ספין?

כבר התייחסתי מספר פעמים בפוסטים על מכניקת הקוונטים לגודל פיזיקלי שנקרא ספין, אבל בשום שלב לא הסברתי באמת מה המשמעות שלו. ספין (מהמילה האנגלית "ספין", שמשמעותה "להסתחרר") הוא גודל פיזיקלי שמייצג את התנע הזוויתי של חלקיק. כפי שיש לכל חלקיק מסה, מטען ועוד, יש לו גם ספין.

אפשר לחשוב על ספין כגודל שקובע "באיזה כיוון חלקיק מסוים מסתחרר". אני בכוונה משתמש במרכאות, כי החלקיק עצמו לא באמת מסתחרר, אבל זו האנלוגיה הכי פשוטה שמאפשרת להסביר את התופעה. תכונת הספין נקשרת להשפעה המגנטית של חלקיק על הסביבה שלו.

 

 

שיעור קצר במכניקה קלאסית

לכל אובייקט מסתובב יש ציר סיבוב. לכדור הארץ, למשל, יש ציר סיבוב לאורך ציר "צפון-דרום". אובייקטים מסתובבים הכי מהר בכיוון שניצב לציר הסיבוב. למשל, כדור הארץ מסתובב הכי מהר בכיוון מזרח-מערב. אבל אם נסתכל על מהירות הסיבוב של כדור הארץ גם בצירים אחרים (כמו צפון מזרח-דרום מערב), נראה שגם בציר הזה הוא מסתובב, פשוט פחות מהר. במילים אחרות, באזור קו המשווה כדור הארץ מסתובב הכי מהר, וככל שמתקרבים לציר צפון-דרום (הקטבים) מהירות הסיבוב של כדור הארץ הולכת וקטנה, עד שמגיעים לקטבים עצמם, בהם כדור הארץ לא באמת זז לשום מקום (אדם שעומד בדיוק בקוטב הצפוני לא ינוע כלל ביחס לציר הסיבוב של כדור הארץ).

היינו מצפים שהתכונה הזו של "הדרגתיות" תהיה נכונה לגבי כל אובייקט מסתובב - לא משנה אם מדובר בכדור הארץ או בגרעין של אטום, התנע הזוויתי משתנה באופן הדרגתי, כתלות בציר הסיבוב שעליו בוחרים להסתכל. עם זאת, כמו שכבר ראינו בעבר, במכניקת הקוונטים דברים מתחילים להתנהג אחרת.

 

 

המוזרות של הספין

בניגוד לכדור הארץ, בו כשמודדים תנע זוויתי בצירים שונים מקבלים הרבה גדלים שונים, כשמודדים ספין של חלקיק לאורך ציר סיבוב מסוים, ישנן רק שתי תוצאות אפשריות למדידה  - או שהחלקיק מסתובב בכיוון המתאים לציר הסיבוב (נקרא לזה מעתה "ספין כלפי מעלה") או שהוא מסתובב בכיוון ההפוך לציר הסיבוב (נקרא לזה מעתה "ספין כלפי מטה"). כשחושבים על זה, זה נשמע ממש לא הגיוני - כיצד קיימות יש רק שתי תוצאות? הרי אם ניקח את כדור הארץ ונמדוד את התנע הזוויתי שלו לאורך ציר צפון-דרום, זה בכלל לא יהיה הגיוני - אנחנו נקבל 0 (כי כאמור, בקטבים כדור הארץ לא מסתובב). אם היינו מקבלים ממדידה כזו תוצאה כגון "למעלה" או "למטה" זה היה נראה לנו מגוחך. אבל כמו בהרבה תחומים שנפגשנו בהם במכניקת הקוונטים, אנחנו צריכים לצאת לרגע מהחשיבה המסורתית שלנו.

אז כן - ספין הוא תכונה קוונטית. דהיינו, הוא יכול לקבל רק ערכים בדידים מסוימים - למעלה או למטה. אז מה כן קורה כשמודדים ספין של חלקיק בציר סיבוב אחר? איך בכל זאת מקבלים את אותם ערכים בדידים?

 

מדידה של ספין

מה שמעניין במדידה של ספין של חלקיק מסוים, זה שכשמודדים אותו בציר סיבוב שונה מהציר "האמיתי" שלו, המדידה יכולה להשפיע על הספין של החלקיק. נניח שלחלקיק שאני מודד יש ספין בציר סיבוב מסוים, למשל "צפון-דרום". במידה ואני אחליט למדוד באמצעות מכשיר המדידה שלי את הספין של החלקיק בציר סיבוב אחר ("מזרח-מערב" לדוגמא). מפני שאני יכול לקבל רק שני ערכים בדידים - למעלה ולמטה - הדבר "מאלץ" את החלקיק לשנות את ציר הסיבוב שלו לציר הסיבוב שבחרתי למדוד אותו בו - "מזרח-מערב". לאחר שהמדידה תתבצע, אני אקבל תוצאת למעלה או למטה בכיוון ציר הסיבוב שבחרתי, והתוצאה שאקבל באמת תייצג את הספין החדש של החלקיק. במילים אחרות, ציר הסיבוב שבוחרים למדידה משפיע על החלקיק עצמו.

אגב, איזו תוצאה אקבל במדידה עצמה - למעלה או למטה? מפני שהציר "מזרח-מערב" הוא שונה לחלוטין מציר "צפון-דרום" (במילים אחרות, אין להם שום רכיבים וקטוריים משותפים), יש סיכוי של 50% שהספין של החלקיק יהיה כלפי מעלה, וסיכוי של 50% שהספין של החלקיק יהיה כלפי מטה. אין שום דרך לדעת איזו תוצאה תצא - כל מדידה מקבלת תוצאה אקראית מהשתיים (נקשר לרעיון הסופרפוזיציה). ההסתברות לקבלת כל תוצאה תלויה בזווית בין ציר הסיבוב המקורי של החלקיק לבין ציר הסיבוב שבחרתי.

כך, לדוגמה, נניח שיש לי חלקיק בעל ספין למעלה לאורך ציר "צפון-דרום", ושאני בוחר למדוד את הספין שלו לאורך ציר "צפון מזרח-דרום מערב" (כפי שמופיע בציור למטה). קל לראות שבציר המדידה החדש שבחרנו, הספין המקורי יותר "קרוב" מבחינה וקטורית לכיוון של צפון-מזרח מאשר לכיוון של דרום-מערב. לכן, יש סיכוי גבוה שהספין שיתקבל במדידה בציר החדש יהיה כלפי מעלה (לכיוון צפון-מזרח), ורק סיכוי קטן שהספין שיתקבל יהיה כלפי מטה (לכיוון דרום-מערב). הסיכוי לספין כלפי מעלה הוא לא 100% מפני שציר המדידה הוא לא בדיוק ציר הספין המקורי, אבל מפני שהוא קרוב אליו, הסיכוי עדיין גבוה יותר מהסיכוי לספין כלפי מטה. אם למשל הייתי בוחר את הציר ההפוך, רוב הסיכויים היו שיתקבל ספין מטה לכיוון דרום-מערב.

 

 

ההתנהגות הקלאסית של ספין

אמנם עד עכשיו ראינו שספין מתנהג בצורה מאוד שונה מאובייקטים בחיי היום-יום; בכל מדידה שאנחנו מבצעים אנחנו עלולים לקבל ספין אחר עבור חלקיק מסוים - למעלה או למטה. אבל בואו נסתכל דקה על התמונה הגדולה:

נסתכל שוב על הדוגמה בה יש לנו חלקיק בעל ספין בציר צפון-דרום, ואנחנו מחליטים למדוד אותו בציר מזרח-מערב. כאמור, מפני שכיוון המדידה שונה לחלוטין מכיוון ציר הספין המקורי, בחצי מהמדידות אנחנו נקבל ספין למעלה (נקרא לתוצאה שכזו +1) ובחצי השני נקבל ספין למטה (נקרא לתוצאה זו -1). אם ניקח את הממוצע של המדידות, אנחנו נקבל 0 בדיוק. אבל רגע, זו בדיוק אותה תוצאה שאנחנו מקבלים במכניקה הקלאסית! אם, למשל, היינו מודדים את מהירות הסיבוב של כדור הארץ בקטבים, היינו מקבלים 0 כתשובה, בדיוק כמו שקיבלנו במקרה של הספין הממוצע.

אז במילים אחרות, אמנם הספין הוא תכונה שמפגינה התנהגות מוזרה וקוונטית, אבל בממוצע, הוא מעניק את אותן תוצאות שמקבלים במכניקה הקלאסית.

___________________________________________________________________________

 

זהו על ספין להיום. בפוסט הבא (הפעם באמת חח) אכתוב על משפט בל, שמוכיח באמצעות תכונת הספין שמכניקת הקוונטים לא יכולה להיות תורת משתנים חבויים, כפי שגורס פרדוקס EPR.

עד אז, מאוד אשמח לשמוע מה דעתכם על הנושא ועל מה עוד הייתם רוצים לקרוא. אם יש משהו שדורש הבהרה, מוזמנים להגיד לי (כי לכתוב על גודל פיזיקלי מוזר כמו ספין באופן מתומצת זו משימה לא פשוטה, ובלי ספק יש חלקים שיכולים להיות יותר ברורים).

שיהיה שבוע טוב! חיוך

 

נכתב על ידי קרל שוורצשילד , 20/5/2017 16:45   בקטגוריות פיזיקה, מכניקת קוונטים  
12 תגובות   הצג תגובות    הוסף תגובה   הוסף הפניה   קישור ישיר   שתף   המלץ   הצע ציטוט
 



פרדוקס EPR ומשפט בל


אחרי הרבה זמן, אני שמח להודיע שחזרנו למכניקת קוונטים! מפני שעברו כמה חודשים טובים מאז הפוסטים האחרונים בנושא, אני ממליץ למי שמעוניין לקרוא את שאר הפוסטים בסדרה - 1, 2, 3, 4, 5. פוסט מס' 5 חשוב במיוחד לצורך הפוסט של היום, אז אלא אם יש לכם היכרות כללית עם הנושא, כדאי לכם לפחות לקרוא אותו לפני שאתם קוראים את הפוסט הזה.

 

בפוסט האחרון עסקתי בשזירה קוונטית - תהליך שיוצר מין קשר מהותי בין שני חלקיקים, כך שמדידת תכונותיו של החלקיק האחד משפיעה באופן מיידי על תכונותיו של החלקיק השני, גם אם החלקיקים בכלל לא נמצאים באותו מקום. אנלוגיה שהצגתי בפוסט הקודם היא של הטלת שני מטבעות - שני המטבעות נמצאים בסופרפוזיציה של "עץ" ו-"פלי", אבל אחרי שמודדים מטבע אחד, לא רק שהמצב שלו נקבע סופית ("עץ" למשל),  אלא שהדבר גם קובע מיידית את מצבו של השני ("פלי"), גם אם המטבעות רחוקים אחד מהשני.

את הפוסט סיימתי בהעלאת תהייה גדולה מאוד על פשר התופעה - איך דבר כזה יתכן? כיצד יכול חלקיק אחד להשפיע באופן מיידי על חלקיק אחר?

היום אני רוצה לעסוק בפרדוקס החשוב הזה במכניקת הקוונטים, ופוסט הבא אני אציג את הניסוי שהכריע אותו אחד ולתמיד.

 

נתחיל בכמה מונחי יסוד

מאז תחילת דרכה של הפיזיקה, היו כמו עקרונות מפתח שהנחו אותה. מכל אלה, שני העקרונות הכי מרכזיים היו דטרמיניזם ולוקליות.

- עקרון הדטרמיניזם - עקרון הקובע שכל תופעה פיזיקלית נקבעת באופן אבסולוטי ומדויק על ידי אירועים קודמים. כלומר - הטבע לא מתנהג באקראיות, לכל תופעה פיזיקלית יש סיבה ברורה שגרמה לה לקרות. גם תהליכים אקראיים לכאורה, כגון הטלת קוביה, נקבעים על ידי חוקים ברורים. במידה ולוקחים בחשבון את כל הכוחות הפועלים על הקוביה, ניתן לחשב בדיוק על איזו פאה היא תנחת. זה נשמע מאוד הגיוני, לא? הרי בסופו של דבר, כל אירוע ניתן לתאר באמצעות חוקי טבע, ולכן אם אנחנו יודעים בדיוק מה המערכת עושה בנקודה מסוימת בזמן, ניתן לחשב מה היא תעשה בעתיד ומה היא עשתה בעבר. אם אני רואה כדור מתגלגל במורד הר, אני יכול לדעת בוודאות שהוא התחיל בנקודה גבוהה יותר, ושהוא ימשיך להתגלגל למטה אלא אם משהו יעצור בעדו.

- עקרון הלוקליות (נקרא גם "מקומיות") - קובע שאובייקטים יכולים להשפיע רק על אובייקטים הנמצאים בסביבתם המיידית. במילים אחרות - תהליכים פיזיקליים לא יכולים לקרות בן רגע, הם צריכים לנוע כמו גלים בבריכה; הם לא יכולים פשוט להיות במקום אחד ואז להופיע במקום אחר - הם חייבים להתפשט החוצה. תחשבו לדוגמה על קומקום חם שמניחים במקרר קר. זה ברור לחלוטין שהקומקום יחמם את המקרר (ושהמקרר יקרר את הקומקום), אבל התהליך הזה לא יתרחש מיידית - החום חייב לנוע מהקומקום למקרר. הוא לא יכול פשוט להופיע בקצה המקרר מבלי שעבר קודם כל באמצע שלו.

- הרחבה על עקרון הלוקליות - כשאיינשטיין הגה בתחילת המאה ה-20 את תורת היחסות הכללית, הוא גילה כלל טבע פשוט אבל מדהים - לעקרון הלוקליות יש גבול מהירות עליון. לא רק שאובייקטים לא יכולים להשפיע אחד על השני ממקומות מרוחקים, אלא גם מסתבר שהם יכולים להשפיע על הסביבה המיידית שלהם רק במהירות נמוכה או שווה למהירות האור. גם השפעות שנראות מיידיות, כמו כוח הכבידה, למעשה לא יכולות להשפיע על עצמים מהר יותר ממהירות האור.

 

מכניקת הקוונטים שוברת את כללי המשחק

עד תחילת המאה ה-20, המדע ראה בעקרונות הללו קודש הקודשים. אבל כמו שראינו, פרשנות קופנהגן של מכניקת הקוונטים הגיעה והראתה שעקרון הדטרמיניזם כנראה לא נכון. מסתבר שבקנה המידה התת-אטומי, פונקציות הגל נקבעות על ידי מודלים הסתברותיים, וכל דבר קורה בגדול באופן אקראי - ללא יכולת לחזות באופן מדויק כיצד יתנהג חלקיק מסוים.

המדענים של המאה ה-20, ואיינשטיין בראשם, נורא הודאגו מפרשנות קופנהגן שערערה את עמודי התווך של המדע עד אותה תקופה. על כן, איינשטיין החליט (ביחד עם עמיתיו בוריס פודולסקי ונתן רוזן) לפרסם ניסוי מחשבתי שאמור לכאורה להוכיח שרעיון השזירה הקוונטית הוא שגוי ביסודו (וכתוצאה מכך גם פרשנות קופנהגן עצמה). ניסוי מחשבתי זה מוכר בתור פרדוקס EPR (על שם איינשטיין-פודולסקי-רוזן), והוא מהווה אחת מקריאות התיגר הכי גדולות על מכניקת הקוונטים אי פעם.

 

פרדוקס EPR

הפרדוקס המקורי מתואר על פני ארבעה עמודים, אבל ניתן לתמצת אותו כך:

נניח ששזרנו שני חלקיקים אחד בשני, כך שהספין של האחד חייב להיות כלפי מעלה, והספין של השני חייב להיות כלפי מטה. טרם ביצענו מדידה מפורשת, אז אנחנו לא יודעים איזה ספין שייך לאיזה חלקיק. על פי פרשנות קופנהגן, שני החלקיקים נמצאים בסופרפוזיציה, ובאופן תיאורטי הם נמצאים בו זמנית במצב של ספין למעלה וספין למטה (קצת כמו החתול של שרודינגר, שהוא כביכול חי ומת בו זמנית). פרשנות קופנהגן מוסיפה ואומרת שרק כאשר נמדוד את הספין של חלקיק הערך המדויק שלו ייקבע (פונקציית הגל תקרוס והוא יצא מסופרפוזיציה), ועל פי רעיון השזירה הקוונטית, הספין של החלקיק השני ייקבע גם הוא.

אבל מה אם לפני שנמדוד את אחד החלקיקים, נרחיק את שני החלקיקים אחד מהשני? מה אם נשים את שני החלקיקים בצדדים שונים של היקום, במרחק מיליארדי שנות אור? על פי פרשנות קופנהגן, כאשר נמדוד חלקיק אחד, מצבו של האחר חייב להיקבע באופן מיידי. אבל דבר כזה יפר את עקרון הלוקליות ותורת היחסות הפרטית - הרי ידוע ששני אובייקטים לא יכולים לקיים אינטראקציות אחד עם השני מהר יותר ממהירות האור!

איינשטיין ועמיתיו האמינו שהאפשרות הזו היא מגוחכת, ועל כן הציעו אלטרנטיבה בנושא לפרשנות קופנהגן; הם הציעו שמכניקת הקוונטים אינה מבוססת על הסתברות, אלא שהיא למעשה "תורת משתנים חבויים". במילים אחרות - מכניקת קוונטים היא לא הסתברותית ויש לה כללים ברורים ודטרמיניסטיים, אנחנו פשוט לא יודעים אותם כרגע.

במקרה שלנו, מה המשמעות של "תורת משתנים חבויים"? זה אומר שההנחה שלנו ששני החלקיקים השזורים היו בסופרפוזיציה שגויה. זאת אומרת - זה לא שהחלקיקים היו בשני מצבי ספין בו זמנית ובעת ביצוע המדידה כל אחד קיבל ערך ספין שונה, אלא שני החלקיקים מראש היו בשני מצבי ספין הפוכים ומוגדרים היטב, פשוט לא ידענו על כך כי לא ביצענו מדידה.

זה נשמע כמו ההסבר הכי פשוט כשחושבים על זה - למה להגיד שלחלקיקים לא היה מצב אחד מוגדר, כשאפשר פשוט להאמין שכן היה להם מצב אחד מוגדר, ופשוט לא הייתה לנו דרך לדעת מהו? אמנם ההצעה של EPR לא מעניקה פתרון מדויק לסיפור, אבל היא די מנחמת - היא רומזת שאנחנו לא צריכים לוותר על דטרמיניזם ועל לוקליות, ושמכניקת קוונטים יכולה להיות עקרונית דומה למכניקה הקלאסית.

 

משפט בל

במשך הרבה זמן פרדוקס EPR הצליח לעצור במידת מה את התבססותה של פרשנות קופנהגן. הרבה מדענים העדיפו להאמין שחוקי הטבע קבועים ומוחלטים, ושאנחנו פשוט לא יודעים אותם, מאשר להודות שהטבע הוא למעשה לא דטרמיניסטי ולא לוקלי בקנה המידה התת-אטומי.

עם זאת, בשנות ה-60 הפיזיקאי ג'ון סטיוארט בל הציג את התובנה המדהימה הבאה - מכניקת הקוונטים לא יכולה להיות תורת משתנים חבויים (אני אביע הסתייגות על המשפט הזה בסוף הפוסט, אבל לעת עתה קבלו את המשפט כפי שהוא). במילים אחרות - איינשטיין ועמיתיו צריכים לקבל את העובדה שפרשנות קופנהגן ככל הנראה נכונה (גם בנוגע לזה אביע הסתייגות).

בפוסט הבא אני אסביר בפירוט את הניסוי שבל הציע שהצליח להכריע את הסוגייה. בעיניי, זה אחד הניסויים הכי יפים ואלגנטיים שבוצעו אי פעם. אני כבר בהחלט מחכה לכתוב עליו.

 

סיכום

קצת מצחיק לעשות סיכום כשעוד לא הסברתי איך בדיוק משפט בל הצליח "להציל" את מכניקת הקוונטים, אבל חשוב להבין כבר עכשיו את המשמעות של הסיפור (ראו בזה סיכום ביניים עד הפוסט הבא). זו דוגמה נוספת לסיטואציה שבה מכניקת הקוונטים סותרת את ההיגיון הכי בסיסי של המדע, אבל מוכיחה את עצמה כנכונה בסופו של דבר. במקרה הזה, מדובר בערעור על חלק מהרעיונות הכי חשובים במדע - דטרמיניזם, לוקליות ותורת היחסות הפרטית.

אני לא רוצה שתחשבו בינתיים שהלוקליות מתה ושתורת היחסות הכללית לא שווה כלום, כי בפוסט הבא אנחנו נראה שזה לא מדויק לחלוטין. אבל מה שבטוח זה שהשזירה הקוונטית מראה סתירה ללוקליות במובן המסורתי שלה. אני גם רוצה לסייג קצת את הדברים שלי, ולהדגיש שמשפט בל לא בהכרח מבטיח שפרשנות קופנהגן נכונה, הוא פשוט מראה שבמובן הספציפי הזה, היא צדקה.

מבטיח שעד סוף הפוסט הבא כל הסתירות הפנימיות האלה יהיו הרבה יותר ברורות :)

_______________________________________________________________________

 

שאלה להרהור:

במהלך שני הפוסטים האחרונים אני הצגתי את הרעיון שבשזירה קוונטית, קביעת מצבו של אובייקט אחד קובעת את מצבו של האחר באופן מיידי. אבל בשום נקודה לא הסברתי בדיוק מדוע זה חייב לקרות באופן מיידי, ולא במהירות האור למשל. נסו לחשוב בעצמכם מדוע קריסת פונקציית הגל של חלקיק אחד חייבת להוביל לקריסת פונקציית הגל של האחר באופן מיידי. רמז גדול מופיע בפוסט מס' 5 בסדרה.

אם אתם חושבים שיש לכם מושג, מוזמנים לכתוב לי בתגובות.

_______________________________________________________________________

 

זהו להיום. באמת שכחתי כמה אני נהנה לכתוב על מכניקת קוונטים ואני מקווה שזה גם מהנה לקריאה וקל להבנה. במידה ויש לכם הצעות כלשהן לדרכים שבהן המידע יכול להיות יותר מונגש, יותר מאשמח לשמוע, כי זה באמת חומר שגם ככה קשה לעכל. אתם גם תמיד מוזמנים לכתוב לי על מה מעניין אתכם לקרוא מלבד מכניקת קוונטים.

ל"ג בעומר שמח! חיוך

 

נכתב על ידי קרל שוורצשילד , 13/5/2017 12:24   בקטגוריות מכניקת קוונטים, פיזיקה  
6 תגובות   הצג תגובות    הוסף תגובה   1 הפניות לכאן   קישור ישיר   שתף   המלץ   הצע ציטוט
 



המשפט היסודי של החשבון הדיפרנציאלי והאינטגרלי


הרבה מהאנשים שקוראים פה התבקשו בשיעורי מתמטיקה בתיכון לחשב את השטח בין גרף של פונקציה מסוימת לבין הצירים. במקרים כאלה, תלמידים נוהגים לרוב לפלוט באופן אוטומטי את המילה "אינטגרל", מבלי להקדיש לזה יותר מדי מחשבה. אבל מה זה אומר בעצם?

לאחר שכתבתי את הפוסט הקודם (שעסק בשיטת חישוב דמוית אינטגרל שפותחה ביוון העתיקה) התבקשתי לשפוך קצת אור על הנושא - מה המשמעות של אינטגרל, איך הוא נקשר לנגזרת ומדוע זה דווקא ככה. באותו שבוע העברתי שיעור פרטי לתלמיד שהתקשה עם אינטגרלים, וגם לו לא טרחו להסביר בשום נקודה מה בעצם הוא עושה. הסתבר שהמקור לקושי שלו היה בדיוק האופן הלקוי שבו הציגו לו את האינטגרל - כשבלונת קסם שנפלה מהשמים ושאין צורך להסביר מה הקשר בינה לבין המציאות.

הפוסט לא ייכנס לדקויות של האופן שבו מחשבים את האינטגרלים, הגדרות פורמליות או הוכחות מדויקות. הוא פשוט בא להסביר את הקונספט באופן יותר היוריסטי ואינטואיטיבי למי ששמע על אינטגרלים בכיתה אבל ההסבר נראה בעיניו קצת תלוש מהמציאות. מקווה שיעזור להבין.

_______________________________________________________________________________

 

נניח שאנחנו רוצים לחשב את השטח מתחת לגרף של פונקציה כלשהי. יש הרבה סיבות לרצות לעשות כזה דבר, במיוחד בפיזיקה. איך אנחנו אמורים לעשות כזה דבר?

במקרה של פונקציה פשוטה יחסית - y=3 למשל, זה קל. אנחנו פשוט צריכים לחשב שטח של מלבן:

 

 

אז עבור כל ערך X שנבחר, השטח שמתחת הגרף יהיה שווה 3X.

זה מקרה מאוד פשוט יחסית. אבל מה בנוגע למקרים קצת יותר מסובכים? מה אם הפונקציה שלנו היא לא ליניארית?

בואו ניקח פונקציה קצת יותר מורכבת - . גרף של פונקציה כזאת הוא פרבולה. כיצד מחשבים שטח של פרבולה? הרי הפעם אנחנו לא עוסקים במלבנים. למרות זאת, אם נסתכל על גרף הפונקציה, נראה שנוכל לקחת את הפרבולה ולחלק אותה למלבנים קצת יותר קטנים:

 

 

כשאנחנו מחלקים את הפרבולה למלבנים קטנים, אנחנו יכולים להתייחס אל כל מלבן כאל טווח שבו הפונקציה היא "כאילו" מלבן, ולהשתמש בשטח המלבן כדי לחשב בקירוב את השטח של אותו אזור בפרבולה. זה לא יוצא בדיוק אותו שטח כמו הפרבולה, אבל זה די קרוב. החלק החשוב הוא שככל שנבחר במלבנים יותר ויותר דקים, כך השטח יהיה יותר קרוב לערך המדויק של שטח הפרבולה. שימו לב:

 

 

נכון שזה כבר קירוב לא רע בכלל? גם את המלבנים האלה ניתן לחלק למלבנים דקים יותר ויותר, באופן שיספק קירוב טוב יותר ויותר של שטח הגרף.

 

אבל מה זה אינטגרל?

אינטגרל הוא כלי מתמטי שמבטא את הרעיון שראינו למעלה. האינטגרל של פונקציה A הוא פונקציה B שמחזירה את השטח השטח בין פונקציה A לבין הצירים עבור כל טווח שנבחר. הוא עושה זאת על ידי חלוקה של אותה פונקציה למלבנים קטנים. אבל מה שמיוחד באינטגרל זה שבמקום לחלק את הגרף לכמות סופית של מלבנים (כמו בציורים למעלה), הוא מחלק אותו לכמות אינסופית של מלבנים דקיקים, באופן שמספק שיעור מדויק של השטח מתחת הגרף. אפשר לחשוב על אינטגרל ככלי שניתן לחשב באמצעותו סכומים של אינסוף מספרים - הרי הוא למעשה מחלק פונקציה לאינסוף מלבנים ומחזיר את סכום השטחים שלהם.

פה ניכר הדמיון בין האינטגרל לבין שיטת המיצוי של ארכימדס - שתי השיטות מתבססות על חלוקה של צורה מסוימת לצורות קטנות יותר. ההבדל המרכזי הוא ששיטת ארכימדס נותנת קירוב שתלוי בחלוקה שנבחר - ככל שנבחר בחלוקה יותר דקה (כמו במקרה של המצולעים המשוכללים והמעגל), כך נקבל קירוב יותר טוב של הצורה. לעומת זאת, האינטגרל מחלק את הצורה לכמות אינסופית של חלקים, באופן שנותן לנו את הגבול של התשובה המדויקת.

עד כאן הכל טוב ויפה - האינטגרל הוא פונקציית שטח של פונקציה אחרת. אבל מה הקשר בין הפונקציה המקורית לבין האינטגרל שלה?

 

 

 

המשפט היסודי של החשבון הדיפרנציאלי והאינטגרלי

הגענו ללב הפוסט - המשפט הכי חשוב בחדו"א, שקושר בין שני המונחים במרכזיים של התחום - האינטגרל והנגזרת. למשפט יש מספר ניסוחים שונים, הפשוט ביותר הולך כך:

תהא A פונקציה, ויהא B האינטגרל של פונקציה A. הנגזרת של האינטגרל B היא הפונקציה A. או במילים אחרות - גזירה ואינטגרציה הן פעולות הופכיות זו לזו.

אם אתם מכירים את המושג אינטגרל מבית הספר, זה לא אמור להפתיע אתכם; הרי בבית ספר מציגים את זה בתור עובדה קיימת - אם רוצים למצוא שטח של פונקציה, מוצאים את הפונקציה הקדומה שלה, שהיא האינטגרל. אבל למען האמת, פונקציה קדומה ואינטגרל הם לא אותו דבר - ראיתם שכשהגדרנו למעלה מהו אינטגרל, לא התייחסנו בשום נקודה לנגזרת או לפונקציה קדומה. לכן, כדאי להקדיש מחשבה לשאלה למה שני המושגים כן קשורים אחד לשני. ממה נובע המשפט? מי החליט שהפונקציה הקדומה מייצגת את השטח?

 

הוכחה מתמטית

בואו נניח שיש לנו פונקציה f כלשהי, ושקיים עבור אותה פונקציה אינטגרל F (אגב, לא לכל פונקציה יש אינטגרל, אבל אני אתעלם מהעובדה החשובה הזו בחינניות). נניח שאנחנו רוצים לחשב את השטח של הפונקציה f בין הנקודות 0 ו-X (כלומר, השטח בין ציר ה-y והקו המקווקו השמאלי בציור):

 

 

האינטגרל יכול להחזיר לנו את אותו שטח. אבל נניח שאנחנו מחליטים שאנחנו רוצים להגדיל את הטווח של השטח טיפה - לא ל-X, אלא טיפ-טיפה מעבר. אנחנו מחליטים להזיז את הקו המקווקו ב- קטן כלשהו. מפני שהשטח שמחזיר האינטגרל תלוי ב-X שאנחנו מציבים בו, אם נציב בו את ה-'X הטיפה יותר גדול שלנו, אנחנו נקבל את השטח המעודכן של הפונקציה.

בנוסף, אם נחסר מהשטח החדש שלנו את האינטגרל המקורי של X, אנחנו נקבל למעשה את השטח בין X לבין X' (אם לא ברור לכם מדוע, הסתכלו בציור). כאשר  הולך וקטן, השטח הקטן הזה הולך ונהיה דומה יותר ויותר למלבן. השטח של אותו מלבן שווה לרוחב שלו (שהוא ) כפול הגובה שלו (שהוא פשוט ). מפני ש-'X פשוט שווה ל-X ועוד , ניתן להגיע לשוויון הבא:

 

 

אנחנו רוצים להוכיח שהנגזרת של האינטגרל שווה לפונקציה המקורית. אז בואו נחשב את הנגזרת של האינטגרל על פי הגדרת הנגזרת:

 

 

נציב במקום המונה את השוויון שקיבלנו לפני מספר שורות:

    (נצמצם ב-)

 

 

(וכעת נשתמש בעובדה ש- שואף ל-0 ופשוט נסלק אותו מהמשוואה:

 

 

וזהו! הוכחנו שהנגזרת של האינטגרל היא הפונקציה המקורית. זוהי בעצם הסיבה שמרבים להשתמש במושגים אינטגרל ופונקציה קדומה כמילים נרדפות (למרות ההבדל המהותי בין השניים).

 

הסבר אינטואיטיבי

אני חושב שהוכחה מתמטית היא אף פעם לא מספקת אלא אם עומד הסבר לוגי כלשהו מאחוריה. לכן אני עומד לנסות להסביר את ההיגיון מאחורי השוויון המוזר הזה במילים שלי, איך שאני מבין אותו.

הסיבה האינטואיטיבית לכך שהמשפט היסודי הזה קיים נובעת מעצם ההגדרה של המונח נגזרת. כן, נגזרת שווה לשיפוע של הפונקציה. אבל באופן יותר מהותי, היא מתארת את קצב השינוי שלה. הנגזרת באה להסביר לנו כמה מהר פונקציה גדלה או קטנה באזור מסוים. עכשיו, בואו נסתכל עוד פעם על גרף של הפונקציה f מלמעלה:

 

 

ובואו נחשוב שוב על המשמעות של אינטגרל. אינטגרל מתאר את השטח של הפונקציה. זה אומר שכשהערך של הפונקציה גדל (כלומר, השטח שלה גדל בקצב יותר מהיר), גם האינטגרל שלה גדל בקצב יותר מהיר. גם ההפך נכון - במקרה וערך הפונקציה הולך וקטן, השטח גדל בקצב יותר ויותר איטי.

כאמור, אם נסתכל על חלק קטן מאוד בפונקציה (על  ששואף ל-0), השטח של אותו אזור יהיה קרוב מאוד למלבן. השטח של אותו מלבן תלוי בשני דברים - ברוחב שלו ובגובה שלו. מפני שהרוחב שלו שווה בכל מקרה ל-  ששואף ל-0, אנחנו מבינים שהגורם שבאמת מכריע את גודל השטח הוא גובה המלבן, כלומר - ערך ה-y של הפונקציה באותו . ככל שערך ה-y בטווח  יותר גדול, כך השטח יגדל יותר מהר, ולהפך - אם ערך ה-y יהיה קטן מאוד, השטח יגדל לאט מאוד. כלומר - קיים יחס ישר בין קצב השינוי של האינטגרל לבין ערך הפונקציה המקורית באותה נקודה. או במילים אחרות - הנגזרת של האינטגרל  שווה לפונקציית המקור.

זה מאוד הגיוני כשחושבים על זה - קצב השינוי של שטח גרף הפונקציה (האינטגרל) חייב להיקבע על ידי הערך של הפונקציה עצמה - הרי מה עוד יוכל לקבוע אותו?

______________________________________________________________________

 

אני מקווה שהפוסט עזר להבהיר חלק מהרעיונות הלא פשוטים שעומדים מאחורי המשפט הזה. גילוי נאות - זה נושא שנורא קשה להסביר מבלי להתייחס למונח מרכזי כמו "גבול". אבל אני חושב שמי שבאמת מתעניין בהוכחות פורמליות והגדרות מדויקות מוזמן לעשות זאת בעצמו - אני מעוניין בעיקר להסביר את הרעיון המופשט מאחורי כל הסיפור.

כרגיל - אשמח מאוד לשמוע מה דעתכם על הפוסט. האם הסיבה לקשר בין האינטגרל לנגזרת יותר ברורה? האם יש לכם הסבר נוסף למשפט? אני תמיד מעוניין לשמוע מה אתם חושבים.

אם יש נושא נוסף שהייתם רוצים לקרוא עליו - מוזמנים לכתוב לי! כרגע התכנון שלי לשבוע הבא זה כנראה להתחיל לכתוב על כמה נושאים יסודיים בקוסמולוגיה וחקר היקום, אבל אני תמיד פתוח להצעות לנושאים שמעניינים אתכם.

נתראה בשבוע הבא! חיוך

 

נכתב על ידי קרל שוורצשילד , 6/5/2017 16:42   בקטגוריות הוכחות, מתמטיקה  
11 תגובות   הצג תגובות    הוסף תגובה   הוסף הפניה   קישור ישיר   שתף   המלץ   הצע ציטוט
 





Avatarכינוי:  קרל שוורצשילד

בן: 21




הבלוג משוייך לקטגוריות: מדע וטכנולוגיה
© הזכויות לתכנים בעמוד זה שייכות לקרל שוורצשילד אלא אם צויין אחרת
האחריות לתכנים בעמוד זה חלה על קרל שוורצשילד ועליו/ה בלבד
כל הזכויות שמורות 2017 © נענע 10 בע"מ