דלג לתוכן הראשי

מידע קלאסי

כדי לתאר מידע קוונטי ואת אופן פעולתו, נתחיל בסקירה של מידע קלאסי. טבעי לתהות מדוע מוקדשת כל כך הרבה תשומת לב למידע קלאסי בקורס על מידע קוונטי, אבל יש לכך סיבות טובות.

ראשית, למרות שמידע קוונטי ומידע קלאסי שונים זה מזה בדרכים מרהיבות, התיאורים המתמטיים שלהם דומים למעשה מאוד. מידע קלאסי גם משמש כנקודת ייחוס מוכרת בעת לימוד מידע קוונטי, וכמקור לאנלוגיה שמגיעה רחוק באופן מפתיע. נפוץ שאנשים שואלים שאלות על מידע קוונטי שיש להן אנלוגיות קלאסיות טבעיות, ולעתים קרובות לשאלות אלה יש תשובות פשוטות שיכולות לספק בהירות ותובנה לשאלות המקוריות על מידע קוונטי. אכן, לא מוגזם לטעון שאי אפשר להבין מידע קוונטי באמת מבלי להבין מידע קלאסי.

חלק מהקוראים אולי כבר מכירים את החומר שיידון בחלק זה, ואחרים אולי לא — אך הדיון מיועד לשתי הקהלים. בנוסף להדגשת ההיבטים של מידע קלאסי הרלוונטיים ביותר למבוא למידע קוונטי, חלק זה מציג את סימון דיראק, המשמש לעתים קרובות לתיאור וקטורים ומטריצות במידע ובחישוב קוונטי. כפי שמתברר, סימון דיראק אינו ספציפי למידע קוונטי; ניתן להשתמש בו באותה מידה בהקשר של מידע קלאסי, וכן עבור הגדרות רבות אחרות שבהן מופיעים וקטורים ומטריצות.

מצבים קלאסיים ווקטורי הסתברות

נניח שיש לנו מערכת המאחסנת מידע. ליתר דיוק, נניח שמערכת זו יכולה להיות באחד ממספר סופי של מצבים קלאסיים בכל רגע. כאן, המונח מצב קלאסי יש להבין במונחים אינטואיטיביים, כתצורה שניתן לזהות ולתאר בצורה חד-משמעית.

הדוגמה המסורתית, שנחזור אליה שוב ושוב, היא של סיביות (bit), שהיא מערכת שמצביה הקלאסיים הם 00 ו-1.1. דוגמאות נוספות כוללות קובייה בת שש פאות, שמצביה הקלאסיים הם 1,1, 2,2, 3,3, 4,4, 5,5, ו-66 (המיוצגים על ידי מספר הנקודות המתאים על הפאה שנמצאת למעלה); בסיס גרעיני בגדיל DNA, שמצביה הקלאסיים הם A, C, G, ו-T; ומתג על מאוורר חשמלי, שמצביה הקלאסיים הם (בדרך כלל) גבוה, בינוני, נמוך, ו-כבוי. במונחים מתמטיים, מפרט המצבים הקלאסיים של מערכת הוא, למעשה, נקודת ההתחלה: אנו מגדירים סיבית להיות מערכת שיש לה מצבים קלאסיים 00 ו-1,1, וכך גם עבור מערכות בעלות קבוצות מצבים קלאסיים שונות.

לצורך דיון זה, נקרא בשם X\mathsf{X} למערכת הנחשבת, ונשתמש בסמל Σ\Sigma להתייחסות לקבוצת המצבים הקלאסיים של X.\mathsf{X}. בנוסף להנחה ש-Σ\Sigma היא סופית, שכבר הוזכרה, אנו מניחים באופן טבעי ש-Σ\Sigma היא לא ריקה — שכן חסר היגיון שמערכת פיזית לא תהיה לה כלל מצבים. ולמרות שיש טעם לשקול מערכות פיזיות בעלות אינסוף מצבים קלאסיים, נתעלם מאפשרות זו, שהיא בהחלט מעניינת אך לא רלוונטית לקורס זה. מסיבות אלה, ולמען הנוחות והתמציתיות, נשתמש מכאן ואילך במונח קבוצת מצבים קלאסית לציון כל קבוצה סופית ולא ריקה.

הנה כמה דוגמאות:

  1. אם X\mathsf{X} היא סיבית, אז Σ={0,1}.\Sigma = \{0,1\}. במילים, נתייחס לקבוצה זו כאלפבית הבינארי.
  2. אם X\mathsf{X} היא קובייה בת שש פאות, אז Σ={1,2,3,4,5,6}.\Sigma = \{1,2,3,4,5,6\}.
  3. אם X\mathsf{X} הוא מתג מאוורר חשמלי, אז Σ={high,medium,low,off}.\Sigma = \{\mathrm{high}, \mathrm{medium}, \mathrm{low}, \mathrm{off}\}.

כשחושבים על X\mathsf{X} כנשא מידע, ניתן לייחס משמעויות מסוימות למצבים הקלאסיים השונים של X\mathsf{X}, המובילות לתוצאות או השלכות שונות. במקרים כאלה, אולי יספיק לתאר את X\mathsf{X} כפשוט נמצא באחד ממצביו הקלאסיים האפשריים. לדוגמה, אם X\mathsf{X} הוא מתג מאוורר, אולי נדע בוודאות שהוא מוגדר על גבוה, מה שעלול לגרום לנו לעבור אותו ל-בינוני.

לעתים קרובות בעיבוד מידע, לעומת זאת, הידע שלנו אינו ודאי. דרך אחת לייצג את הידע שלנו על המצב הקלאסי של מערכת X\mathsf{X} היא לשייך הסתברויות למצביה הקלאסיים האפשריים השונים, ויוצרת מה שנכנה מצב הסתברותי.

לדוגמה, נניח ש-X\mathsf{X} היא סיבית. בהתבסס על מה שאנו יודעים או מצפים לגבי מה שקרה ל-X\mathsf{X} בעבר, אולי נאמין ש-X\mathsf{X} נמצאת במצב הקלאסי 00 עם הסתברות 3/43/4 ובמצב 11 עם הסתברות 1/4.1/4. ניתן לייצג אמונות אלה על ידי כתיבה:

Pr(X=0)=34andPr(X=1)=14.\operatorname{Pr}(\mathsf{X}=0) = \frac{3}{4} \quad\text{and}\quad \operatorname{Pr}(\mathsf{X}=1) = \frac{1}{4}.

דרך תמציתית יותר לייצג מצב הסתברותי זה היא על ידי וקטור עמודה.

(3414)\begin{pmatrix} \frac{3}{4}\\[2mm] \frac{1}{4} \end{pmatrix}

הסתברות הסיבית להיות 00 מוצבת בראש הוקטור והסתברות הסיבית להיות 11 מוצבת בתחתית, מפני שזהו הסדר המקובל לסדר את הקבוצה {0,1}.\{0,1\}.

בכלל, ניתן לייצג מצב הסתברותי של מערכת בעלת כל קבוצת מצבים קלאסית באותה דרך, כוקטור הסתברויות. ניתן לסדר את ההסתברויות בכל דרך שנבחר, אך בדרך כלל יש דרך טבעית או ברירת מחדל לעשות זאת. להיות מדויקים, ניתן לייצג כל מצב הסתברותי דרך וקטור עמודה המקיים שתי תכונות:

  1. כל הרכיבים של הוקטור הם מספרים ממשיים אי-שליליים.
  2. סכום הרכיבים שווה ל-1.1.

לעומת זאת, כל וקטור עמודה המקיים שתי תכונות אלה יכול להיחשב כייצוג של מצב הסתברותי. מכאן ואילך, נתייחס לוקטורים בצורה זו כוקטורי הסתברות.

לצד התמציתיות של סימון זה, לזהות מצבים הסתברותיים כוקטורי עמודה יש יתרון בכך שפעולות על מצבים הסתברותיים מיוצגות דרך הכפלת מטריצה-וקטור, כפי שיידון בקרוב.

מדידת מצבים הסתברותיים

בואו נשקול בשלב הבא מה קורה אם אנחנו מודדים מערכת כשהיא במצב הסתברותי. בהקשר זה, מדידת מערכת פשוט אומרת שאנחנו מסתכלים על המערכת ומזהים איזה מצב קלאסי היא נמצאת בו ללא עמימות. באופן אינטואיטיבי, אנחנו לא יכולים "לראות" מצב הסתברותי של מערכת; כשאנחנו מסתכלים עליה, אנחנו פשוט רואים אחד מהמצבים הקלאסיים האפשריים.

על ידי מדידת מערכת, אנחנו גם עשויים לשנות את הידע שלנו עליה, ולכן המצב ההסתברותי שאנחנו משייכים לה יכול להשתנות. כלומר, אם נזהה ש-X\mathsf{X} נמצאת במצב הקלאסי aΣ,a\in\Sigma, אז וקטור ההסתברות החדש המייצג את הידע שלנו על מצב X\mathsf{X} הופך להיות הוקטור בעל 11 ברכיב המתאים ל-aa ו-00 לכל שאר הרכיבים. וקטור זה מצביע על כך ש-X\mathsf{X} נמצאת במצב הקלאסי aa בוודאות — שאנחנו יודעים לאחר שזיהינו אותה — ואנחנו מסמנים וקטור זה על ידי a,\vert a\rangle, הנקרא "קט aa" מסיבה שתוסבר בקרוב. וקטורים מסוג זה נקראים גם וקטורי בסיס סטנדרטי.

לדוגמה, בהנחה שהמערכת שבראשנו היא סיבית, וקטורי הבסיס הסטנדרטי ניתנים על ידי

0=(10)and1=(01). \vert 0\rangle = \begin{pmatrix}1\\[1mm] 0\end{pmatrix} \quad\text{and}\quad \vert 1\rangle = \begin{pmatrix}0\\[1mm] 1\end{pmatrix}.

שים לב שכל וקטור עמודה דו-ממדי ניתן לביטוי כצירוף לינארי של שני וקטורים אלה. לדוגמה,

(3414)=340+141.\begin{pmatrix} \frac{3}{4}\\[2mm] \frac{1}{4} \end{pmatrix} = \frac{3}{4}\,\vert 0\rangle + \frac{1}{4}\,\vert 1\rangle.

עובדה זו מכלילה באופן טבעי לכל קבוצת מצבים קלאסית: כל וקטור עמודה ניתן לכתיבה כצירוף לינארי של מצבי בסיס סטנדרטי. לעתים קרובות מאוד אנו מבטאים וקטורים בדיוק בדרך זו.

חוזרים לשינוי מצב הסתברותי לאחר מדידה, ניתן לציין את הקשר הבא לחוויות היומיומיות שלנו. נניח שאנחנו מטילים מטבע הוגן, אך מכסים את המטבע לפני שמסתכלים עליו. אז נאמר שהמצב ההסתברותי שלו הוא

(1212)=12heads+12tails.\begin{pmatrix} \frac{1}{2}\\[2mm] \frac{1}{2} \end{pmatrix} = \frac{1}{2}\,\vert\text{heads}\rangle + \frac{1}{2}\,\vert\text{tails}\rangle.

כאן, קבוצת המצבים הקלאסית של המטבע שלנו היא {heads,tails}.\{\text{heads},\text{tails}\}. נבחר לסדר מצבים אלה עם heads קודם, tails שני.

heads=(10)andtails=(01)\vert\text{heads}\rangle = \begin{pmatrix}1\\[1mm] 0\end{pmatrix} \quad\text{and}\quad \vert\text{tails}\rangle = \begin{pmatrix}0\\[1mm] 1\end{pmatrix}

אם היינו מגלים את המטבע ומסתכלים עליו, היינו רואים אחד משני המצבים הקלאסיים: heads או tails. בהנחה שהתוצאה הייתה tails, היינו מעדכנים באופן טבעי את תיאור המצב ההסתברותי של המטבע כך שיהפוך ל-tails.|\text{tails}\rangle. כמובן, אם היינו מכסים את המטבע מחדש, ואז מגלים אותו ומסתכלים עליו שוב, המצב הקלאסי עדיין יהיה tails, דבר עקבי עם תיאור המצב ההסתברותי על ידי הוקטור tails.|\text{tails}\rangle.

זה אולי נראה טריוויאלי, ובמובן מסוים הוא אכן כך. אולם, בעוד שמערכות קוונטיות מתנהגות בדרך אנלוגית לחלוטין, תכונות המדידה שלהן נחשבות לעתים קרובות מוזרות או יוצאות דופן. על ידי ביסוס התכונות האנלוגיות של מערכות קלאסיות, אופן פעולת מידע קוונטי עשוי להיראות פחות יוצא דופן.

הערה אחרונה לגבי מדידות של מצבים הסתברותיים היא זו: מצבים הסתברותיים מתארים ידע או אמונה, לא בהכרח משהו ממשי, ומדידה רק משנה את הידע שלנו ולא את המערכת עצמה. לדוגמה, המצב של מטבע לאחר שהטלנו אותו, אך לפני שהסתכלנו, הוא either heads או tails — אנחנו פשוט לא יודעים איזה עד שנסתכל. לאחר שנראה שהמצב הקלאסי הוא tails, למשל, היינו מעדכנים באופן טבעי את הוקטור המתאר את הידע שלנו ל-tails,|\text{tails}\rangle, אך למישהו אחר שלא ראה את המטבע כשנחשף, המצב ההסתברותי יישאר ללא שינוי. זה לא מקור לדאגה; אנשים שונים עשויים להיות בעלי ידע או אמונות שונות לגבי מערכת מסוימת, ולכן לתאר מערכת זו על ידי וקטורי הסתברות שונים.

פעולות קלאסיות

בחלק האחרון של סיכום קצר זה של מידע קלאסי, נשקול את סוגי הפעולות שניתן לבצע על מערכת קלאסית.

פעולות דטרמיניסטיות

ראשית, יש פעולות דטרמיניסטיות, שבהן כל מצב קלאסי aΣa\in\Sigma מומר ל-f(a)f(a) עבור פונקציה ff כלשהי מהצורה f:ΣΣ.f:\Sigma\rightarrow\Sigma.

לדוגמה, אם Σ={0,1},\Sigma = \{0,1\}, יש ארבע פונקציות מצורה זו, f1,f_1, f2,f_2, f3,f_3, ו-f4,f_4, הניתנות לייצוג בטבלאות ערכים כדלקמן:

af1(a)0010af2(a)0011af3(a)0110af4(a)0111\begin{array}{c|c} a & f_1(a)\\ \hline 0 & 0\\ 1 & 0 \end{array} \qquad \begin{array}{c|c} a & f_2(a)\\ \hline 0 & 0\\ 1 & 1 \end{array} \qquad \begin{array}{c|c} a & f_3(a)\\ \hline 0 & 1\\ 1 & 0 \end{array} \qquad \begin{array}{c|c} a & f_4(a)\\ \hline 0 & 1\\ 1 & 1 \end{array}

הראשונה והאחרונה מבין הפונקציות הללו הן קבועות: f1(a)=0f_1(a) = 0 ו-f4(a)=1f_4(a) = 1 לכל aΣ.a\in\Sigma. שתי האמצעיות אינן קבועות, הן מאוזנות: כל אחד משני ערכי הפלט מופיע אותו מספר פעמים (פעם אחת, במקרה זה) כשאנחנו עוברים על הקלטים האפשריים. הפונקציה f2f_2 היא פונקציית הזהות: f2(a)=af_2(a) = a לכל aΣ.a\in\Sigma. ו-f3f_3 היא הפונקציה f3(0)=1f_3(0) = 1 ו-f3(1)=0,f_3(1) = 0, הידועה יותר בשם פונקציית NOT.

ניתן לייצג את פעולות הפעולות הדטרמיניסטיות על מצבים הסתברותיים דרך הכפלת מטריצה-וקטור. ספציפית, המטריצה MM המייצגת פונקציה נתונה f:ΣΣf:\Sigma\rightarrow\Sigma היא זו המקיימת

Ma=f(a)M \vert a \rangle = \vert f(a)\rangle

לכל aΣ.a\in\Sigma. מטריצה כזו תמיד קיימת ונקבעת באופן ייחודי על ידי דרישה זו. מטריצות המייצגות פעולות דטרמיניסטיות תמיד יש להן בדיוק אחד 11 בכל עמודה, ו-00 לכל שאר הרכיבים.

לדוגמה, המטריצות M1,,M4M_1,\ldots,M_4 המתאימות לפונקציות f1,,f4f_1,\ldots,f_4 לעיל הן כדלקמן:

M1=(1100),M2=(1001),M3=(0110),M4=(0011). M_1 = \begin{pmatrix} 1 & 1\\ 0 & 0 \end{pmatrix}, \hspace{4mm} M_2 = \begin{pmatrix} 1 & 0\\ 0 & 1 \end{pmatrix}, \hspace{4mm} M_3 = \begin{pmatrix} 0 & 1\\ 1 & 0 \end{pmatrix}, \hspace{4mm} M_4 = \begin{pmatrix} 0 & 0\\ 1 & 1 \end{pmatrix}.

הנה אימות מהיר המראה שהמטריצה הראשונה נכונה. שלוש האחרות ניתן לבדוק באופן דומה.

M10=(1100)(10)=(10)=0=f1(0)M11=(1100)(01)=(10)=0=f1(1)\begin{aligned} M_1 \vert 0\rangle & = \begin{pmatrix} 1 & 1\\ 0 & 0 \end{pmatrix} \begin{pmatrix} 1\\ 0 \end{pmatrix} = \begin{pmatrix} 1\\ 0 \end{pmatrix} = \vert 0\rangle = \vert f_1(0)\rangle \\[4mm] M_1 \vert 1\rangle & = \begin{pmatrix} 1 & 1\\ 0 & 0 \end{pmatrix} \begin{pmatrix} 0\\ 1 \end{pmatrix} = \begin{pmatrix} 1\\ 0 \end{pmatrix} = \vert 0\rangle = \vert f_1(1)\rangle \end{aligned}

דרך נוחה לייצג מטריצות מצורות אלה ואחרות משתמשת בסימון אנלוגי לוקטורי שורה לזה של וקטורי עמודה שנדון קודם: אנו מסמנים ב-a\langle a \vert את וקטור השורה בעל 11 ברכיב המתאים ל-aa ואפס לכל שאר הרכיבים, לכל aΣ.a\in\Sigma. וקטור זה נקרא "ברא a.a."

לדוגמה, אם Σ={0,1},\Sigma = \{0,1\}, אז

0=(10)and1=(01). \langle 0 \vert = \begin{pmatrix} 1 & 0 \end{pmatrix} \quad\text{and}\quad \langle 1 \vert = \begin{pmatrix} 0 & 1 \end{pmatrix}.

לכל קבוצת מצבים קלאסית Σ,\Sigma, ניתן לראות וקטורי שורה ווקטורי עמודה כמטריצות, ולבצע את הכפל המטריצי ba.\vert b\rangle \langle a\vert. אנו מקבלים מטריצה ריבועית בעלת 11 ברכיב המתאים לזוג (b,a),(b,a), כלומר שורת הרכיב מתאימה למצב הקלאסי bb והעמודה מתאימה למצב הקלאסי a,a, עם 00 לכל שאר הרכיבים. לדוגמה,

01=(10)(01)=(0100). \vert 0 \rangle \langle 1 \vert = \begin{pmatrix} 1\\ 0 \end{pmatrix} \begin{pmatrix} 0 & 1 \end{pmatrix} = \begin{pmatrix} 0 & 1 \\ 0 & 0 \end{pmatrix}.

בשימוש בסימון זה, ניתן לבטא את המטריצה MM המתאימה לכל פונקציה נתונה f:ΣΣf:\Sigma\rightarrow\Sigma כ-

M=aΣf(a)a. M = \sum_{a\in\Sigma} \vert f(a) \rangle \langle a \vert.

לדוגמה, נשקול את הפונקציה f4f_4 לעיל, שעבורה Σ={0,1}.\Sigma = \{0,1\}. אנו מקבלים את המטריצה

M4=f4(0)0+f4(1)1=10+11=(0010)+(0001)=(0011).M_4 = \vert f_4(0) \rangle \langle 0 \vert + \vert f_4(1) \rangle \langle 1 \vert = \vert 1\rangle \langle 0\vert + \vert 1\rangle \langle 1\vert = \begin{pmatrix} 0 & 0\\ 1 & 0 \end{pmatrix} + \begin{pmatrix} 0 & 0\\ 0 & 1 \end{pmatrix} = \begin{pmatrix} 0 & 0\\ 1 & 1 \end{pmatrix}.

הסיבה שזה עובד היא כדלקמן. אם נחשוב שוב על וקטורים כמטריצות, והפעם נשקול את הכפל ab,\langle a \vert \vert b \rangle, נקבל מטריצה 1×11\times 1, עליה ניתן לחשוב כסקלר (כלומר, מספר). למען הסדר, נכתוב מכפלה זו כ-ab\langle a \vert b\rangle ולא כ-ab.\langle a \vert \vert b \rangle. מכפלה זו מקיימת את הנוסחה הפשוטה הבאה:

ab={1a=b0ab. \langle a \vert b \rangle = \begin{cases} 1 & a = b\\[1mm] 0 & a \neq b. \end{cases}

בשימוש בתצפית זו, יחד עם העובדה שהכפל המטריצי הוא אסוציאטיבי ולינארי, אנו מקבלים

Mb=(aΣf(a)a)b=aΣf(a)ab=f(b), M \vert b \rangle = \Biggl( \sum_{a\in\Sigma} \vert f(a) \rangle \langle a \vert \Biggr) \vert b\rangle = \sum_{a\in\Sigma} \vert f(a) \rangle \langle a \vert b \rangle = \vert f(b)\rangle,

לכל bΣ,b\in\Sigma, שהוא בדיוק מה שאנו דורשים מהמטריצה M.M.

כפי שנדון ביתר פירוט בשיעור מאוחר יותר, ab\langle a \vert b \rangle ניתן לראות גם כמכפלה פנימית בין הוקטורים a\vert a\rangle ו-b.\vert b\rangle. מכפלות פנימיות הן חיוניות ביותר במידע קוונטי, אך נדחה דיון בהן עד שיהיו נחוצות.

בשלב זה, השמות "ברא" ו"קט" אולי ברורים: חיבור "ברא" a\langle a\vert יחד עם "קט" b\vert b\rangle מניב "סוגריים" ab.\langle a \vert b\rangle. סימון ומינוח זה נובעים מפול דיראק, ומסיבה זו ידוע בשם סימון דיראק.

פעולות הסתברותיות ומטריצות סטוכסטיות

בנוסף לפעולות דטרמיניסטיות, קיימות גם פעולות הסתברותיות.

לדוגמה, נשקול את הפעולה הבאה על ביט. אם המצב הקלאסי של הביט הוא 0,0, הוא נשאר כפי שהוא; ואם המצב הקלאסי של הביט הוא 1,1, הוא מתהפך, כך שהוא הופך ל-00 בהסתברות 1/21/2 ול-11 בהסתברות 1/2.1/2. פעולה זו מיוצגת על ידי המטריצה

(112012). \begin{pmatrix} 1 & \frac{1}{2}\\[1mm] 0 & \frac{1}{2} \end{pmatrix}.

ניתן לוודא שהמטריצה עושה את הדבר הנכון על ידי כפל שני וקטורי הבסיס הסטנדרטיים בה.

עבור בחירה שרירותית של קבוצת מצבים קלאסיים, ניתן לתאר את כל הפעולות ההסתברותיות במושגים מתמטיים כאלה המיוצגות על ידי מטריצות סטוכסטיות, שהן מטריצות המקיימות שתי תכונות אלה:

  1. כל הרכיבים הם מספרים ממשיים אי-שליליים.
  2. הרכיבים בכל עמודה מסתכמים ל-1.1.

במילים אחרות, מטריצות סטוכסטיות הן מטריצות שכל עמודותיהן מהוות וקטורי הסתברות.

ניתן לחשוב על פעולות הסתברותיות ברמה האינטואיטיבית כפעולות שבהן אקראיות עשויה להיות מעורבת או מוכנסת בתהליך, בדיוק כמו בדוגמה למעלה. ביחס לתיאור המטריצה הסטוכסטית של פעולה הסתברותית, כל עמודה ניתן לראות כייצוג וקטורי של המצב ההסתברותי הנוצר בהינתן שהמצב הקלאסי של הקלט מתאים לאותה עמודה.

ניתן גם לחשוב על מטריצות סטוכסטיות כמטריצות שתמיד ממפות וקטורי הסתברות לוקטורי הסתברות. כלומר, מטריצות סטוכסטיות תמיד ממפות וקטורי הסתברות לוקטורי הסתברות, וכל מטריצה שתמיד ממפות וקטורי הסתברות לוקטורי הסתברות חייבת להיות מטריצה סטוכסטית.

לבסוף, דרך חשיבה אחרת על פעולות הסתברותיות היא שהן בחירות אקראיות של פעולות דטרמיניסטיות. לדוגמה, ניתן לחשוב על הפעולה בדוגמה למעלה כיישום של פונקציית הזהות או פונקציית הקבוע 0, כל אחת בהסתברות 1/2.1/2. הדבר עקבי עם המשוואה

(112012)=12(1001)+12(1100). \begin{pmatrix} 1 & \frac{1}{2}\\[1mm] 0 & \frac{1}{2} \end{pmatrix} = \frac{1}{2} \begin{pmatrix} 1 & 0\\[1mm] 0 & 1 \end{pmatrix} + \frac{1}{2} \begin{pmatrix} 1 & 1\\[1mm] 0 & 0 \end{pmatrix}.

ביטוי כזה תמיד אפשרי, עבור בחירה שרירותית של קבוצת מצבים קלאסיים וכל מטריצה סטוכסטית שורות ועמודותיה מזוהות עם אותה קבוצת מצבים קלאסיים.

הרכבות של פעולות הסתברותיות

נניח ש-X\mathsf{X} הוא מערכת בעלת קבוצת מצבים קלאסיים Σ,\Sigma, ו-M1,,MnM_1,\ldots,M_n הן מטריצות סטוכסטיות המייצגות פעולות הסתברותיות על המערכת X.\mathsf{X}.

אם הפעולה הראשונה M1M_1 מיושמת על המצב ההסתברותי המיוצג על ידי וקטור הסתברות u,u, המצב ההסתברותי המתקבל מיוצג על ידי הוקטור M1u.M_1 u. אם לאחר מכן נפעיל את הפעולה ההסתברותית השנייה M2M_2 על וקטור ההסתברות החדש הזה, נקבל את וקטור ההסתברות

M2(M1u)=(M2M1)u. M_2 (M_1 u) = (M_2 M_1) u.

השוויון נובע מכך שכפל מטריצות (הכולל כפל מטריצה-וקטור כמקרה פרטי) הוא פעולה אסוציאטיבית. לפיכך, הפעולה ההסתברותית המתקבלת מהרכבת הפעולה הראשונה והשנייה, כשמיישמים קודם את M1M_1 ואחר כך את M2,M_2, מיוצגת על ידי המטריצה M2M1,M_2 M_1, שהיא בהכרח סטוכסטית.

באופן כללי יותר, הרכבת הפעולות ההסתברותיות המיוצגות על ידי המטריצות M1,,MnM_1,\ldots,M_n בסדר זה, כלומר M1M_1 מיושמת ראשונה, M2M_2 שנייה, וכן הלאה, כש-MnM_n מיושמת אחרונה, מיוצגת על ידי מכפלת המטריצות

MnM1. M_n \,\cdots\, M_1.

שים לב שהסדר חשוב כאן: למרות שכפל מטריצות הוא אסוציאטיבי, הוא אינו פעולה קומוטטיבית. לדוגמה, אם

M1=(1100)andM2=(0110), M_1 = \begin{pmatrix} 1 & 1\\[1mm] 0 & 0 \end{pmatrix} \quad\text{and}\quad M_2 = \begin{pmatrix} 0 & 1\\[1mm] 1 & 0 \end{pmatrix},

אז

M2M1=(0011)andM1M2=(1100). M_2 M_1 = \begin{pmatrix} 0 & 0 \\[1mm] 1 & 1 \end{pmatrix} \quad\text{and}\quad M_1 M_2 = \begin{pmatrix} 1 & 1\\[1mm] 0 & 0 \end{pmatrix}.