revisions
[lambda.git] / exercises / _assignment5.mdwn
1 ω Ω λ Λ ≡ α β
2
3 ## Option / Maybe Types ##
4
5 You've already defined and worked with `map` as a function on lists. Now we're going to work instead with the type OCaml defines like this:
6
7     type ('a) option = None | Some of 'a
8
9 and Haskell defines like this:
10
11     data Maybe a = Nothing | Just a
12
13 That is, instances of this type are either an instance of `'a` (this can be any type), wrapped up in a `Some` or `Just` box, or they are a separate value representing a failure. This is sort of like working with a set or a list guaranteed to be either singleton or empty.
14
15 In one of the homework meetings, Chris posed the challenge: you know those dividers they use in checkout lines to separate your purchases from the next person's? What if you wanted to buy one of those dividers? How could they tell whether it belonged to your purchases or was separating them from others?
16
17 The OCaml and Haskell solution is to use not supermarket dividers but instead those gray bins from airport security. If you want to buy something, it goes into a bin. (OCaml's `Some`, Haskell's `Just`). If you want to separate your stuff from the next person, you send an empty bin (OCaml's `None`, Haskell's `Nothing`). If you happen to be buying a bin, OK, you put that into a bin. In OCaml it'd be `Some None` (or `Some (Some stuff)` if the bin you're buying itself contains some stuff); in Haskell `Just Nothing`. This way, we can't confuse a bin that contains a bin with an empty bin. (Not even if the contained bin is itself empty.)
18
19 1.  Your first problem is to write a `maybe_map` function for these types. Here is the type of the function you should write:
20
21         (* OCaml *)
22         maybe_map : ('a -> 'b) -> ('a) option -> ('b) option
23
24         -- Haskell
25         maybe_map :: (a -> b) -> Maybe a -> Maybe b
26
27     If your `maybe_map` function is given a `None` or `Nothing` as its second argument, that should be what it returns. Otherwise, it should apply the function it got as its first argument to the contents of the `Some` or `Just` bin that it got as its second, and return the result, wrapped back up in a `Some` or `Just`. (Yes, we know that the `fmap` function in Haskell already implements this functionality. Your job is to write it yourself.)
28
29     One way to extract the contents of an `option`/`Maybe` value is to pattern match on that value, as you did with lists. In OCaml:
30
31         match m with
32         | None -> ...
33         | Some y -> ...
34
35     In Haskell:
36
37         case m of {
38           Nothing -> ...;
39           Just y -> ...
40         }
41
42     Some other tips: In OCaml you write recursive functions using `let rec`, in Haskell you just use `let` (it's already assumed to be recursive). In OCaml when you finish typing something and want the interpreter to parse it, check and display its type, and evaluate it, type `;;` and then return. You may want to review the [[Rosetta pages here]] and also read some of the tutorials we linked to [[for OCaml]] or [[for Haskell]]. [WHERE]
43
44
45 2.  Next write a `maybe_map2` function. Its type should be:
46
47         (* OCaml *)
48         maybe_map2 : ('a -> 'b -> 'c) -> ('a) option -> ('b) option -> ('c) option
49
50         -- Haskell
51         maybe_map2 :: (a -> b -> c) -> Maybe a -> Maybe b -> Maybe c
52
53
54
55 ## Color Trees ##
56
57 (The questions on Color and Search Trees are adapted from homeworks in Chapters 1 and 2 of Friedman and Wand, *Essentials of Programming Languages*.)
58
59 Here are type definitions for one kind of binary tree:
60
61     (* OCaml *)
62     type color = Red | Green | Blue | ... (* you can add as many as you like *)
63     type ('a) color_tree = Leaf of 'a | Branch of 'a color_tree * color * 'a color_tree
64
65     -- Haskell
66     data Color = Red | Green | Blue | ...  deriving (Eq, Show)
67     data Color_tree a = Leaf a | Branch (Color_tree a) Color (Color_tree a)  deriving (Show)
68
69 These trees always have colors labeling their inner branching nodes, and will have elements of some type 'a labeling their leaves. `(int) color_tree`s will have `int`s there, `(bool) color_tree`s will have `bool`s there, and so on. The `deriving (Eq, Show)` part at the end of the Haskell declarations is boilerplate to tell Haskell you want to be able to compare the colors for equality, and also that you want the Haskell interpreter to display colors and lists to you when they are the result of evaluating an expression.
70
71 Here's how you create an instance of such a tree:
72
73     (* OCaml *)
74     let t1 = Branch (Leaf 1, Red, Branch (Leaf 2, Green, Leaf 0))
75
76     -- Haskell
77     let t1 = Branch (Leaf 1) Red (Branch (Leaf 2) Green (Leaf 0))
78
79 Here's how you pattern match such a tree, binding variables to its components:
80
81     (* OCaml *)
82     match t with
83     | Leaf n -> false
84     | Branch (_, c, _) -> c = Red
85
86     -- Haskell
87     case t of {
88       Leaf n -> False;
89       Branch _ c _ -> c == Red
90     }
91
92 These expressions query whether `t` is a branching `color_tree` (not a leaf) whose root is labeled `Red`.
93
94 Choose one of these languages and write the following functions.
95
96
97 3.  Define a function `tree_map` whose type is (as shown by OCaml): `('a -> 'b) -> ('a) color_tree -> ('b) color_tree`. It expects a function `f` and an `('a) color_tree`, and returns a new tree with the same structure and inner branch colors as the original, but with all of its leaves now having had `f` applied to their original value. So for example, `map (2*) t1` would return `t1` with all of its leaf values doubled.
98
99 4.  Define a function `tree_foldleft` that accepts an argument `g : 'z -> 'a -> 'z` and a seed value `z : 'z` and a tree  `t : ('a) color_tree`, and returns the result of applying `g` first to `z` and `t`'s leftmost leaf, and then applying `g` to *that result* and `t`'s second-leftmost leaf, and so on, all the way across `t`'s fringe. Only the leaf values affect the result; the inner branch colors are ignored.
100
101 5.  How would you use the function defined in problem 4 (the previous problem) to sum up the values labeling the leaves of an `(int) color_tree`?
102
103 6.  How would you use the function defined in problem 4 to enumerate a tree's fringe? (Don't worry about whether it comes out left-to-right or right-to-left.)
104
105 7.  Write a recursive function to make a copy of a `color_tree` with the same structure and inner branch colors, but where the leftmost leaf is now labeled `0`, the second-leftmost leaf is now labeled `1`, and so on.
106
107 8.  (More challenging.) Write a recursive function that makes a copy of a `color_tree` with the same structure and inner branch colors, but replaces each leaf label with the `int` that reports how many of that leaf's ancestors are labeled `Red`. For example, if we give your function a tree:
108
109     <pre>
110         Red
111         / \
112       Blue \
113       / \  Green
114      a   b  / \
115            c   Red
116                / \
117               d   e
118     </pre>
119
120     (for any leaf values `a` through `e`), it should return:
121
122     <pre>
123         Red
124         / \
125       Blue \
126       / \  Green
127      1   1  / \
128            1   Red
129                / \
130               2   2
131     </pre>
132
133 9.  (More challenging.) Assume you have a `color_tree` whose leaves are labeled with `int`s (which may be negative). For this problem, assume also that the the same color never labels multiple inner branches. Write a recursive function that reports which color has the greatest "score" when you sum up all the values of its descendent leaves. Since some leaves may have negative values, the answer won't always be the color at the tree root. In the case of ties, you can return whichever of the highest scoring colors you like.
134
135
136 ## Search Trees ##
137
138 (More challenging.) For the next problem, assume the following type definition:
139
140     (* OCaml *)
141     type search_tree = Nil | Inner of search_tree * int * search_tree
142
143     -- Haskell
144     data Search_tree = Nil | Inner Search_tree Int Search_tree  deriving (Show)
145
146 That is, its leaves have no labels and its inner nodes are labeled with `int`s. Additionally, assume that all the `int`s in branches descending to the left from a given node will be less than the `int` of that parent node, and all the `int`s in branches descending to the right will be greater. We can't straightforwardly specify this constraint in OCaml's or Haskell's type definitions. We just have to be sure to maintain it by hand.
147
148 10. Write a function `search_for` with the following type, as displayed by OCaml:
149
150         type direction = Left | Right
151         search_for : int -> search_tree -> direction list option
152
153     Haskell would say instead:
154
155         data Direction = Left | Right  deriving (Eq, Show)
156         search_for :: Int -> Search_tree -> Maybe [Direction]
157
158     Your function should search through the tree for the specified `int`. If it's never found, it should return the value OCaml calls `None` and Haskell calls `Nothing`. If it finds the `int` right at the root of the `search_tree`, it should return the value OCaml calls `Some []` and Haskell calls `Just []`. If it finds the `int` by first going down the left branch from the tree root, and then going right twice, it should return `Some [Left; Right; Right]` or `Just [Left, Right, Right]`.
159
160
161 ## More Map2s ##
162
163 Above, you defined `maybe_map2` [WHERE]. Before we encountered `map2` for lists. There are in fact several different approaches to mapping two lists together.
164
165 11. One approach is to apply the supplied function to the first element of each list, and then to the second element of each list, and so on, until the lists are exhausted. If the lists are of different lengths, you might stop with the shortest, or you might raise an error. Different implementations make different choices about that. Let's call this function:
166
167         (* OCaml *)
168         map2_zip : ('a -> 'b -> 'c) -> ('a) list -> ('b) list -> ('c) list
169
170     Write a recursive function that implements this, in Haskell or OCaml. Let's say you can stop when the shorter list runs out, if they're of different lengths. (OCaml and Haskell each already have functions in their standard libraries --- `map2` or `zipWith` -- that do this. And it also corresponds to a list comprehension you can write in Haskell like this:
171
172         :set -XParallelListComp
173         [ f x y | x <- xs | y <- ys ]
174
175     <!-- or `f <$/fmap> ZipList xs <*/ap> ZipList ys`; or `pure f <*> ...`; or `liftA2 f (ZipList xs) (ZipList ys)` -->
176     But we want you to write this function from scratch.)
177
178 12. What is the relation between the function you just wrote, and the `maybe_map2` function you wrote for problem 2, above?
179
180 13. Another strategy is to take the *cross product* of the two lists. If the function:
181
182         (* OCaml *)
183         map2_cross : ('a -> 'b -> 'c) -> ('a) list -> ('b) list -> ('c) list
184
185     is applied to the arguments `f`, `[x0, x1, x2]`, and `[y0, y1]`, then the result should be: `[f x0 y0, f x0 y1, f x1 y0, f x1 y1, f x2 y0, f x2 y1]`. Write this function.
186     <!-- in Haskell, `liftA2 f xs ys` -->
187
188 A similar choice between "zipping" and "crossing" could be made when `map2`-ing two trees. For example, the trees:
189
190 <pre>
191     0       5
192    / \     / \
193   1   2   6   7
194  / \         / \
195  3  4        8  9
196 </pre>
197
198 could be "zipped" like this (ignoring any parts of branches on the one tree that extend farther than the corresponding branch on the other):
199
200 <pre>
201    f 0 5
202    /    \
203 f 1 6  f 2 7
204 </pre>
205
206 14. You can try defining that if you like, for extra credit.
207
208 "Crossing" the trees would instead add copies of the second tree as subtrees replacing each leaf of the original tree, with the leaves of that larger tree labeled with `f` applied to `3` and `6`, then `f` applied to `3` and `8`, and so on across the fringe of the second tree; then beginning again (in the subtree that replaces the `4` leaf) with `f` applied to `4` and `6`, and so on.
209
210 *   In all the plain `map` functions, whether for lists, or for `option`/`Maybe`s, or for trees, the structure of the result exactly matched the structure of the argument.
211
212 *   In the `map2` functions, whether for lists or for `option`/`Maybe`s or for trees, and whether done in the "zipping" style or in the "crossing" style, the structure of the result may be a bit different from the structure of the arguments. But the *structure* of the arguments is enough to determine the structure of the result; you don't have to look at the specific list elements or labels on a tree's leaves or nodes to know what the *structure* of the result will be.
213
214 *   We can imagine more radical transformations, where the structure of the result *does* depend on what specific elements the original structure(s) had. For example, what if we had to transform a tree by turning every leaf into a subtree that contained all of those leaf's prime factors? Or consider our problem from last week [WHERE] where you converted `[3, 2, 0, 1]` not into `[[3,3,3], [2,2], [], [1]]` --- which still has the same structure, that is length, as the original --- but rather into `[3, 3, 3, 2, 2, 1]` --- which doesn't.
215     (Some of you had the idea last week to define this last transformation in Haskell as `[x | x <- [3,2,0,1], y <- [0..(x-1)]]`, which just looks like a cross product, that we counted under the *previous* bullet point. However, in that expression, the second list's structure depends upon the specific values of the elements in the first list. So it's still true, as I said, that you can't specify the structure of the output list without looking at those elements.)
216
217 These three levels of how radical a transformation you are making to a structure, and the parallels between the transformations to lists, to `option`/`Maybe`s, and to trees, will be ideas we build on in coming weeks.
218
219
220
221
222
223 ## Untyped Lambda Terms ##
224
225 In OCaml, you can define some datatypes that represent terms in the untyped Lambda Calculus like this:
226
227     type identifier = string
228     type lambda_term = Var of identifier | Abstract of identifier * _____ | App of _____
229
230 We've left some gaps.
231
232 In Haskell, you'd define it instead like this:
233
234     type Identifier = String
235     data Lambda_term = Var Identifier | Abstract Identifier _____ | App ________
236
237 15. Again, we've left some gaps. Choose one of these languages and fill in the gaps to complete the definition.
238
239 16. Write a function `occurs_free` that has the following type:
240
241         occurs_free : identifier -> lambda_term -> bool
242
243     That's how OCaml would show it. Haskell would use double colons `::` instead, and would also capitalize all the type names. Your function should tell us whether the supplied identifier ever occurs free in the supplied `lambda_term`.
244
245
246
247
248 ## Encoding Booleans, Church numerals, and Right-Fold Lists in System F ##
249
250 <!-- These questions are adapted from web materials by Umut Acar. Were at <http://www.mpi-sws.org/~umut/>. Now he's moved to <http://www.umut-acar.org/> and I can't find the page anymore. -->
251
252
253 (For the System F questions, you can either work on paper, or download and compile Pierce's evaluator for system F to test your work [WHERE].)
254
255
256 Let's think about the encodings of booleans, numerals and lists in System F,
257 and get datatypes with the same form working in OCaml or Haskell. (Of course, OCaml and Haskell
258 have *native* versions of these types: OCaml's `true`, `1`, and `[1;2;3]`.
259 But the point of our exercise requires that we ignore those.)
260
261 Recall from class System F, or the polymorphic λ-calculus, with this grammar:
262
263     types ::= constants | α ... | type1 -> type2 | ∀α. type
264     expressions ::= x ... | λx:type. expr | expr1 expr2 | Λα. expr | expr [type]
265
266 The boolean type, and its two values, may be encoded as follows:
267
268     Bool ≡ ∀α. α -> α -> α
269     true ≡ Λα. λy:α. λn:α. y
270     false ≡ Λα. λy:α. λn:α. n
271
272 It's used like this:
273
274     b [T] res1 res2
275
276 where `b` is a `Bool` value, and `T` is the shared type of `res1` and `res2`.
277
278
279 17. How should we implement the following terms? Note that the result
280 of applying them to the appropriate arguments should also give us a term of
281 type `Bool`.
282
283     (a) the term `not` that takes an argument of type `Bool` and computes its negation  
284     (b) the term `and` that takes two arguments of type `Bool` and computes their conjunction  
285     (c) the term `or` that takes two arguments of type `Bool` and computes their disjunction
286
287 The type `Nat` (for "natural number") may be encoded as follows:
288
289     Nat ≡ ∀α. (α -> α) -> α -> α
290     zero ≡ Λα. λs:α -> α. λz:α. z
291     succ ≡ λn:Nat. Λα. λs:α -> α. λz:α. s (n [α] s z)
292
293 A number `n` is defined by what it can do, which is to compute a function iterated `n`
294 times. In the polymorphic encoding above, the result of that iteration can be
295 any type `α`, as long as your function is of type `α -> α` and you have a base element of type `α`.
296
297 18. Translate these encodings of booleans and Church numbers into OCaml or Haskell, implementing versions of `sysf_bool`, `sysf_true`, `sysf_false`, `sysf_nat`, `sysf_zero`, `sysf_iszero` (this is what we'd earlier write as `zero?`, but you can't use `?`s in function names in OCaml or Haskell), `sysf_succ`, and `sysf_pred`. We include the `sysf_` prefixes so as not to collide with any similarly-named native functions or values in these languages. Keep in mind the capitalization rules. In OCaml, types are written `sysf_bool`, and in Haskell, they are capitalized `Sysf_bool`. In both languages, variant/constructor tags (like `None` or `Some`) are capitalized, and function names start lowercase. But for this problem, you shouldn't need to use any variant/constructor tags. To get you started, here is how to define `sysf_bool` and `sysf_true` in OCaml:
298
299         type ('a) sysf_bool = 'a -> 'a -> 'a
300         let sysf_true : ('a) sysf_bool = fun y n -> y
301
302     And here in Haskell:
303
304         type Sysf_bool a = a -> a -> a  -- this is a case where Haskell does use `type` instead of `data`
305         -- Now, to my mind the natural thing to write here would be:
306         let sysf_true :: Sysf_bool a = \y n -> y
307         -- But for complicated reasons, that won't work, and you need to do this instead:
308         let { sysf_true :: Sysf_bool a; sysf_true = \y n -> y }
309         -- Or this:
310         let sysf_true = (\y n -> y) :: Sysf_bool a
311
312     Note that in both OCaml and the Haskell code, `sysf_true` can be applied to further arguments directly:
313
314         sysf_true 10 20
315
316     You don't do anything like System F's `true [int] 10 20`. The OCaml and Haskell interpreters figure out what type `sysf_true` needs to be specialized to (in this case, to `int`), and do that automatically.
317
318     It's especially useful for you to implement a version of a System F encoding `pred`, starting with one of the (untyped) versions available in the lambda library accessible from the main wiki page. [WHERE]  The point of the exercise is to do these things on your own, so avoid using the built-in OCaml or Haskell booleans and integers.
319
320
321
322 Consider the following list type, specified using OCaml or Haskell datatypes:
323
324     (* OCaml *)
325     type ('a) my_list = Nil | Cons of 'a * 'a my_list
326
327      -- Haskell
328      data My_list a = Nil | Cons a (My_list a)
329
330 We can encode that type into System F as a right-fold, just as we did in the untyped Lambda Calculus, like this:
331
332     list_T ≡ ∀α. (T -> α -> α) -> α -> α
333     nil_T ≡ Λα. λc:T -> α -> α. λn:α. n
334     cons_T ≡ λx:T. λxs:list_T. Λα. λc:T -> α -> α. λn:α. c x (xs [α] c n)
335
336 As with `Nat`s, the natural recursion is built into our encoding of the list datatype.
337
338 There is some awkwardness here, because System F doesn't have any parameterized types like OCaml's `('a) list` or Haskell's `[a]`. For those, we need to use a more complex system called System F_&omega;. System F *can* already define a more general polymorphic list type:
339
340     list ≡ ∀β. ∀α. (β -> α -> α) -> α -> α
341
342 But this is more awkward to work with, because for functions like `map` we want to give them not just the type:
343
344     (S -> T) -> list -> list
345
346 but more specifically, the type:
347
348     (S -> T) -> list [S] -> list [T]
349
350 Yet we haven't given ourselves the capacity to talk about `list [S]` and so on as a type. Hence, I'll just use the more clumsy, ad hoc specification of `map`'s type as:
351
352     FIXME qua
353     (S -> T) -> list_S -> list_T
354
355 <!--
356     = λf:S -> T. λxs:list. xs [S] [list [T]] (λx:S. λys:list [T]. cons [T] (f x) ys) (nil [T])
357 -->
358
359 19. Convert this list encoding and the `map` function to OCaml or Haskell. Call it `sysf_list`, `sysf_nil` and so on, to avoid collision with the names for native lists in these languages. (In OCaml and Haskell you *can* say `('a) sysf_list` or `Sysf_list a`.)
360
361 20. Also give us the type and definition for a `sysf_head` function. Think about what value to give back if its argument is the empty list.  Ultimately, we might want to make use of the `option`/`Maybe` technique explored in questions 1--2, but for this assignment, just pick a strategy, no matter how clunky. 
362
363 21. Modify the implementation of the predecessor function [[given in the class notes|topics/week5_system_f]] [WHERE] to implement a `sysf_tail` function for your lists.
364
365 Be sure to test your proposals with simple lists. (You'll have to `sysf_cons` up a few sample lists yourself; don't expect OCaml or Haskell to magically translate between their native lists and the ones you've just defined.)
366
367
368
369
370
371
372 ## More on Types ##
373
374 22.  Recall that the **S** combinator is given by `\f g x. f x (g x)`. Give two different typings for this term in OCaml or Haskell. To get you started, here's one typing for **K**:
375
376         # let k (y:'a) (n:'b) = y ;;
377         val k : 'a -> 'b -> 'a = [fun]
378         # k 1 true ;;
379         - : int = 1
380
381     If you can't understand how one term can have several types, recall our discussion in this week's notes [WHERE] of "principal types".
382
383
384
385
386 ## Evaluation Order ##
387
388 Do these last three problems specifically with OCaml in mind, not Haskell. Analogues of the questions exist in Haskell, but because the default evaluation rules for these languages are different, it's too complicated to look at how these questions should be translated into the Haskell setting.
389
390
391 23.  Which of the following expressions is well-typed in OCaml? For those that are, give the type of the expression as a whole. For those that are not, why not?
392
393         let rec f x = f x
394         let rec f x = f f
395         let rec f x = f x in f f
396         let rec f x = f x in f ()
397         let rec f () = f f
398         let rec f () = f ()
399         let rec f () = f () in f f
400         let rec f () = f () in f ()
401
402 24.  Throughout this problem, assume that we have:
403
404         let rec blackhole x = blackhole x
405
406     <!-- Haskell could say: `let blackhole = \x -> fix (\f -> f)` -->
407     All of the following are well-typed. Which ones terminate?  What generalizations can you make?
408
409         blackhole
410         blackhole ()
411         fun () -> blackhole ()
412         (fun () -> blackhole ()) ()
413         if true then blackhole else blackhole
414         if false then blackhole else blackhole
415         if true then blackhole else blackhole ()
416         if false then blackhole else blackhole ()
417         if true then blackhole () else blackhole
418         if false then blackhole () else blackhole
419         if true then blackhole () else blackhole ()
420         if false then blackhole () else blackhole ()
421         let _ = blackhole in 2
422         let _ = blackhole () in 2
423
424 25.  This problem aims to get you thinking about how to control order of evaluation.
425 Here is an attempt to make explicit the behavior of `if ... then ... else ...` explored in the previous question.
426 The idea is to define an `if ... then ... else ...` expression using
427 other expression types.  So assume that `yes` is any (possibly complex) OCaml expression,
428 and `no` is any other OCaml expression (of the same type as `yes`!),
429 and that `bool` is any boolean expression.  Then we can try the following:
430 `if bool then yes else no` should be equivalent to
431
432         let b = bool in
433         let y = yes in
434         let n = no in
435         match b with true -> y | false -> n
436
437     This almost works.  For instance,
438
439         if true then 1 else 2
440
441     evaluates to 1, and
442
443         let b = true in let y = 1 in let n = 2 in
444         match b with true -> y | false -> n
445
446     also evaluates to 1.  Likewise,
447
448         if false then 1 else 2
449
450     and
451
452         let b = false in let y = 1 in let n = 2 in
453         match b with true -> y | false -> n
454
455     both evaluate to 2.
456
457     However,
458
459         let rec blackhole x = blackhole x in
460         if true then blackhole else blackhole ()
461
462     terminates, but
463
464         let rec blackhole x = blackhole x in
465         let b = true in
466         let y = blackhole in
467         let n = blackhole () in
468         match b with true -> y | false -> n
469
470     does not terminate.  Incidentally, using the shorter `match bool with true -> yes | false -> no` rather than the longer `let b = bool ... in match b with ...` *would* work as we desire. But your assignment is to control the evaluation order *without* using the special evaluation order properties of OCaml's native `if` or of its `match`. That is, you must keep the `let b = ... in match b with ...` structure in your answer, though you are allowed to adjust what `b`, `y`, and `n` get assigned to.
471
472     [[hints/assignment 5 hint 1]] WHERE