de391d328ee2c858d3feccae45b3a4cbd41d130e
[lambda.git] / damn.mdwn
1 Expressives such as "damn" have side effects that don't affect the
2 at-issue value of the sentence in which they occur.  What this claim
3 says is unpacked at some length here: <http://tinyurl.com/cbarker/salt/interaction/salt.pdf>.
4
5 <!--
6 Chris also emailed me this paper, may this be publicly posted?
7 <http://tinyurl.com/cbarker/salt/interaction/salt.pdf>
8 -->
9
10
11 In brief, "The man read the damn book" means the same thing as "The
12 man read the book" as far as what must be the case in the world for
13 the sentence to be true.  However, the sentence with the "damn" in it
14 in addition conveys the claim that something about the described
15 situtation is not as it should be.  (The person who is committed to
16 that claim is whoever utters the sentence.)
17
18 So we need a way of evaluating sentences that allows "damn" to launch
19 a side effect without affecting the truth conditions of the sentence
20 in which it occurs.
21
22 Furthermore, we don't want to change the meaning of "the", "man",
23 "read", or "book"---those elements are completely innocent, and
24 shouldn't be burdened with helping compute affective content.
25
26
27 Some nice things: we can remove one or both of the damns, or add more,
28 and everything works.  As desired, the rest of the words don't need to
29 know anything about side effects.
30
31 Some of the complexities:
32
33 Because the compositional semantics doesn't know about words that
34 denote functions, "damn" contributes a trivial adjectival meaning
35 (here, the identity function 'id) to the composition.
36
37
38
39 What we did in Monday's seminar:
40
41 We start with a simulation of semantic composition:
42
43         (cons (cons 'the 'man) 
44                   (cons 'read
45                                 (cons 'the
46                                           'book)))
47
48 ; evaluates to ((the . man) . (read . (the . book)))
49
50 `(cons M N)` is a request to build an ordered pair out of the values M and N.
51 Scheme displays that pair as `(M . N)` You can't write the pair that way yourself:
52 if you tried to, Scheme would think you're trying to apply the function M to some arguments, which you're not, and also
53 Scheme would be confused by what argument the `.` is supposed to be. So, you say:
54         (cons M N)
55 and that evaluates to an ordered pair, and Scheme displays that ordered pair as
56         (M . N)
57 There is an underlying reason why parentheses are used both when displaying the ordered pair, and also to mean "apply this function to these arguments." However, at this point, you may well see this as a confusing overloading of parentheses to fill different syntactic roles.
58
59 Now what about the elements of our ordered pairs. Why do we say `(cons 'the 'man)`. Why are those single quotes there? Well, if you just said `(cons the man)`, Scheme would understand `the` and `man` to be variables, and it would complain that you hadn't bound these variables to any values. We don't want to build an ordered pair out of the values possessed by variables `the` and `man`. Instead, we want to just make up some dummy value THE to stand for the meaning of an object-language determiner, and some dummy value MAN to stand for the meaning of an object-language noun phrase. The notation `'the` is Scheme's way of representing a dummy, atomic value. Note there is no closing single quote, only a prefixed one. Scheme calls these dummy atomic values "symbols." That term is a bit misleading, because the symbol `'the` is not the same as the variable `the`. Neither is it the same as what's called the string `"the"`. The latter is a structured value, composed out of three character values. The symbol `'the`, on the other hand, is an atomic value. It has no parts. (The notation the programmer uses to designate this atomic value has four characters, but the value itself has no parts.) If you think this is all somewhat confusing, you're right. It gets easier with practice.
60
61 `'the` can also be written `(quote the)`. This is even more confusing, because here the `the` is not interpreted as a variable. (Try `(let* ((the 3)) (quote the))`.) If you come across this, just read `(quote the)` as a verbose (and perhaps misleading) way of writing 'the, not as the application of any function to any value.
62
63 Okay, so what we've done is just create a bunch of new atomic values `'the`, `'man`, and so on. Scheme doesn't know how to do much with these. It knows for instance that `'the` is the same value as `'the` and a different value than `'man`. But it doesn't know much more than that. That's all we need or want here.
64
65 And we built a tree out of those values, representing the tree by a nested structure of pairs of leaf-labels.
66
67 The program we submitted to Scheme:
68
69         (cons (cons 'the 'man) 
70                   (cons 'read
71                                 (cons 'the
72                                           'book)))
73
74 evaluates to the nested structure of pairs that Scheme displays as:
75
76         ((the . man) . (read . (the . book)))
77
78 and that we can think of as the tree:
79 ;
80
81              /----------------\
82             /                  \
83            /                    \
84           /                      \
85          /                        \                                  
86         / \                      / \
87        /   \                    /   \
88       /     \                  /     \
89      /       \                /       \
90 meaning of   meaning of   meaning of   \
91   "the"        "man"       "read"      / \
92                                       /   \
93                                      /     \
94                                     /       \
95                                                                 meaning of  meaning of
96                                                                   "the"      "book"
97
98 Okay, let's get back to "damn."
99
100 We start by defining `damn` as a "thunk" that when applied to 0 arguments returns a trivial adjectival meaning, which we'll designate with the dummy symbol `'id`.
101
102 What's a "thunk"?
103
104 Remember, in Scheme you can have functions that take 1 value, and also functions that take 2 values, and also functions that take 0 values. The last ones are called "thunks." The thunk is not identical to the value it returns. For instance:
105
106         (lambda () 3)
107
108 is a thunk that returns the integer 3. If we bind the variable `t` to that thunk, then `t` is a function (Scheme will call it a "procedure") not an integer. Whereas `(t)` is an integer not a function.
109
110 There's no reason yet on hand for us to make `damn` be a thunk. For present purposes, we could also just define `damn` to be the symbol `'id`. But what we're going to go on to do does require us to make `damn` be a thunk. The reason for that is to postpone the evaluation of some expressions until the continuations we want to operate on are in place.
111
112 So for uniformity we're going to make `damn` be a thunk right from the beginning.
113
114 As we said, `damn` starts as a thunk that returns a trivial adjectival meaning `'id`:
115
116         (define damn (lambda () 'id))
117
118 Now we can say:
119
120         (cons (cons 'the 'man) 
121                   (cons 'read
122                                 (cons 'the
123                                           (cons (damn) 
124                                                 'book))))
125
126 and we get back:
127
128         ((the . man) . (read . (the . (id . book))))
129
130
131 Now we want to get some expressive meaning into damn. So we might try:
132
133
134         (define damn (lambda () 'bad))
135
136 But then:
137
138         (cons (cons 'the 'man) 
139                   (cons 'read
140                                 (cons 'the
141                                           (cons (damn) 
142                                                 'book))))
143
144 gives us:
145
146         ((the . man) . (read . (the . (bad . book))))
147
148 Which is not quite what we're looking for. We don't want to contribute the normal adjectival meaning of "bad" to the proposition asserted. Instead we want "bad" to be contributed as a linguistic move on the side. We might try:
149
150         (define damn (lambda () (cons 'side-effect 'bad)))
151
152 But then we'd get:
153
154
155         ((the . man) . (read . (the . ((side-effect . bad) . book))))
156
157 And the context `(the . ( ... . book))` presumably doesn't know how to interact with side-effects. That's precisely the problem we're trying to solve.
158
159
160 A promising way to handle this is with **continuations**, which you will get much more familiar with as this seminar progresses. Don't worry about not understanding what's going on quite yet. This is just an advertisement that's supposed to provoke your imagination.
161
162 Chris and others have applied the apparatus of continuations to the analysis of expressives in the papers linked above. For a simple in-class demonstration, we tried to do this.
163
164 `(call/cc (lambda k ...))` is Scheme's way of writing: bind the continuation of this very complex expression to k and evaluate the `...`.
165
166 So now we define `damn` like this:
167
168
169         (define damn (lambda () (call/cc (lambda (k) (print "bad") (k 'id)))))
170
171 Now when we do:
172
173         (cons (cons 'the 'man) 
174                   (cons 'read
175                                 (cons 'the
176                                           (cons (damn) 
177                                                 'book))))
178
179 we get something like this:
180
181         <bold>"bad"</bad> ((the . man) . (read . (the . (id . book))))
182
183 Yay! The expressive meaning has jumped out of the compositional evaluation of the main sentence, and the context `(the . (... . book))` only has to deal with the trivial adjectival meaning `'id`.
184
185 **But.** As came out in discussion, the `print` we're using here already constitutes a kind of side-effect mechanism of its own. If you say:
186
187         (define three-thunk (lambda () (print "hi") 3))
188
189 and then ask for the evaluation of:
190
191         (+ 2 (three-thunk))
192
193 you'll see something like:
194
195         <bold>"hi"</bad> 5
196
197 So the demonstration we tried in class was pedagogically flawed. It didn't properly display how continuations represent a minimally effective apparatus for representing expressive content. In fact, continuations were still doing the work, but it wasn't the explicit continuations we were writing out for you. It was instead continuations implicit in the `print` operation.
198
199 So a better demonstration would do without any device like `print` that already incorporates continuations implicitly. Any continuation-manipulation should be fully explicit.
200
201 Instead of representing the side-issue expressive contribution by printing "bad", let's instead try to build a pair of side-effect contributions and main-issue assertion. Then what we want would be something like:
202
203         ((side-effect . bad) . ((the . man) . (read . (the . (id . book)))))
204
205 Only we want to get this from the evaluation of:
206
207         (cons (cons 'the 'man) 
208                   (cons 'read
209                                 (cons 'the
210                                           (cons (damn) 
211                                                 'book))))
212
213 where `(damn)` doesn't have widest scope. And we don't want to have to recruit all the other semantic material into accepting and passing along a possible expressive argument.
214
215 How to do this?
216
217 It's not immediately clear how to do it with "undelimited" continuations, of the sort captured by `call/cc`. This is the natural first thing to try:
218
219
220         (define damn (lambda () (call/cc (lambda (k) (cons (cons 'side-effect 'bad) (k 'id))))))
221
222
223 The idea here is we capture the continuation that the thunk `(damn)` has when it gets evaluated. This continuation is bound to the variable `k`. We supply `'id` as an argument to that continuation. When the main-issues tree is all built, then we return a pair `((side-effect bad) MAIN-ISSUE-TREE)`.
224
225 However, this doesn't work. The reason is that an undelimited continuation represents the future of the evaluation of `(damn)` *until the end of the computation*. So when `'id` is supplied to `k`, we go back to building the main-issue tree until we're finished *and that's the end of the computation*. We never get to go back and evaluate the context `(cons (cons 'side-effect 'bad) ...)`.
226
227 The straightforward way to fix this is to use, not undelimited continuations, but instead a more powerful apparatus called "delimited continuations." These too will be explained in due course, don't expect to understand all this now.
228
229 A delimited continuation is captured not by using `call/cc`, but instead by using a variety of other operators. We'll use the operator `shift`. This substitutes for `call/cc`. The syntax in Scheme is slightly different. Whereas we wrote:
230
231         (call/cc (lambda k ...))
232
233 we instead write:
234
235         (shift k ...)
236
237 but the behavior is the same. It's just that now our continuation doesn't stretch until the end of the computation, but only up to some specified limit. The limit of the continuation is specified using the syntax:
238
239         (reset ...)
240
241 This is a kind of continuation-scope-marker. There are some interesting default behaviors if you don't explicitly specify where the limits are. But we'll be fully explicit here.
242
243 If a block `...` never invokes a shift, then `(reset ...)` will evaluate just the same as `...`. So for uniformity, we can designate our continuation-scopes even on computations that don't capture and manipulate continuations.
244
245 Going back to the beginning, then. We start with:
246
247         (define damn (lambda () 'id))
248
249 We evaluate:
250
251         (reset (cons (cons 'the 'man) 
252                   (cons 'read
253                                 (cons 'the
254                                           (cons (damn) 
255                                                 'book)))))
256
257 Remember, the reset isn't actually *doing* anything. It's not a function that's taking the other material as an argument. It's instead a scope-marker. Here it's not even needed (and in fact in the interactive interpreter, it wouldn't even be needed when we invoke continuations, because of the default position it takes).  But we're inserting it to be explicit and uniform.
258
259 Evaluating that gives us:
260
261         ((the . man) . (read . (the . (id . book))))
262
263
264 Now to pair that with an expressive side-issue content, we'd instead define `damn` as:
265
266         (require racket/control) ; this tells Scheme to let us use shift and reset
267         (define damn (lambda () (shift k (cons (cons 'side-effect 'bad) (k 'id)))))
268
269 And voila:
270
271         ((side-effect bad) ((the . man) . (read . (the . (id . book)))))
272
273
274 So that's the straightforward way of repairing the strategy we used in class, without using `print`. We also have to switch to using delimited continuations.
275
276
277 Ken Shan, however, pointed out a lovely way to get to the same end-point still using only undelimited continuations (`call/cc`).
278
279 (let ((pragma
280        ; An ordered pair whose first component is the assertion
281        ; operator, a unary function, and whose second component
282        ; is the meaning of "damn", a thunk.
283        (call/cc (lambda (k)
284           (cons (lambda (p) p)
285                 (lambda () (k (cons (lambda (p) (cons (cons 'side-effect 'bad) p))
286                                     (lambda () 'id)))))))))
287   (let ((assert (car pragma)) ; this binds assert to the first element of the pair pragma
288         (damn   (cdr pragma))) ; this binds damn to the second element of the pair pragma
289     (assert (cons (cons 'the 'student) (cons 'read (cons 'the (cons (damn) 'book)))))))
290
291 We won't do much to explain this. We'll just leave it for you to chew on.
292
293
294
295
296         #lang racket
297         ;(define damn (lambda () 'id))
298         (define damn (lambda () (call/cc (lambda (k) 
299                                                                           ; (k 'id)
300                                                                            (print "Something's bad")
301                                                                            (k 'id)
302                                                                            ))))
303
304         (list (list 'the (list (damn) 'man))
305                   (list 'read 
306                                 (list 'the (list (damn) 'book))))
307
308
309
310
311
312         #lang racket
313         (require racket/control)
314
315         (define damn0 (lambda ()
316                                         'id))
317
318         (define damn1 (lambda ()
319                                         (cons '("side effect" bad)
320                                                   'id)))
321
322         (define damn2 (lambda () (shift k
323                                                                         (cons '("side effect" bad) 
324                                                                                   (list (k 'id))))))
325
326         (define damn3 (lambda () (shift k
327                                                                         (list (k 'id)
328                                                                                   '("side effect" bad)))))
329
330
331 ; Now if we use damn0, our compositional semantics will work OK but
332 ; we don't yet have any expressive contribution:
333
334         (list "main content" 'i (list 'like (list 'the (damn0) 'boy)))
335         ; '("main content" i (like (the id boy)))
336
337
338 ; If we use damn1, we've added in the expressive side-effect:
339
340         (list "main content" 'i (list 'like (list 'the (damn1) 'boy)))
341         ; '("main content" i (like (the (("side effect" bad) . id) boy)))
342
343 ; However, the context (list 'the ... 'boy) is now being asked to operate
344 ; on an element (("side effect" bad) . id), and it may complain it doesn't
345 ; know what that is. It knows how to use 'id to get (list 'the 'id 'boy),
346 ; and how to use 'bad to get (list 'the 'bad 'boy), but we're supposed to
347 ; have something different here.
348
349 ; To get what we want we need to use (delimited) continuations:
350         (reset (list "main content" 'i (list 'like (list 'the (damn2) 'boy))))
351         ; '(("side effect" bad) ("main content" i (like (the id boy))))
352
353 ; or to get the side effect at the end:
354
355         (reset (list "main content" 'i (list 'like (list 'the (damn3) 'boy))))
356         ; '(("main content" i (like (the id boy))) ("side effect" bad))
357
358 ; If you're working in the interactive interpreter, the outermost "reset" here
359 ; is already in its default position, so it doesn't need to be explicitly
360 ; specified:
361
362         (list "main content" 'i (list 'like (list 'the (damn2) 'boy)))
363         ; '(("side effect" bad) ("main content" i (like (the id boy))))
364
365 ; However, if you're executing this as a file, you would need to include explicit resets.
366
367
368
369 ; Instead of using reset/shift you could use an element like "print" in
370 ; building the side-effect, as we did in class. Here you wouldn't require an
371 ; explicit continuation, but as Chris said, that's because "print" already
372 ; represents an implicit continuation.
373
374         (define damn4 (lambda () (begin (print "bad") 'id)))
375         (list "main content" 'i (list 'like (list 'the (damn4) 'boy)))
376         ; "bad"'("main content" i (like (the id boy)))
377 ;
378
379