week4 tweaks
[lambda.git] / code / parse.js
1 // Parser for lambda with let written in Simplified JavaScript
2 //      by Jim Pryor 2010-09-22
3 //      Stripped down from Top Down Operator Precedence : parse.js
4 //      http://javascript.crockford.com/tdop/index.html
5 //      Douglas Crockford 2010-06-26
6
7 //      See also http://effbot.org/zone/simple-top-down-parsing.htm
8
9
10 /*jslint onevar: false
11  */
12
13 /*   members create, error, message, name, prototype, stringify, toSource,
14     toString, write
15 */
16
17 /*global make_var, make_app, make_lam, Lambda_var */
18
19 var make_parse = function () {
20     var symbol_table = {};
21     var token;
22     var tokens;
23     var token_nr;
24
25     var advance = function (id) {
26         var a, o, t, v;
27         if (id && token.id !== id) {
28             token.error("Expected '" + id + "'.");
29         }
30         if (token_nr >= tokens.length) {
31             token = symbol_table["(end)"];
32             return;
33         }
34         t = tokens[token_nr];
35         token_nr += 1;
36         v = t.value;
37         a = t.type;
38         if (a === "name") {
39             o = symbol_table[v];
40             if (!o || typeof o === 'function') {
41                 o = symbol_table["(name)"];
42             } else {
43                 a = o.arity || "keyword";
44             }
45         } else if (a ===  "number") {
46             o = symbol_table["(number)"];
47                         a = "literal";
48         } else if (a === "operator") {
49             o = symbol_table[v];
50             if (!o) {
51                 t.error("Unknown operator.");
52             }
53             a = "keyword";
54         } else {
55             t.error("Unexpected token.");
56         }
57         token = Object.create(o);
58         token.from  = t.from;
59         token.to    = t.to;
60         token.value = v;
61         token.arity = a; // will be: name, keyword, literal
62         return token;
63     };
64
65     var original_symbol = {
66         handler: function () {
67             this.error("Undefined.");
68         }
69     };
70
71         /*
72         try {
73                 if (console && console.debug) {
74                         function print() {
75                                 console.debug.apply(this, arguments);
76                         }
77                 }
78         } catch (e) {}
79         */
80
81     var symbol = function (id) {
82         var s = symbol_table[id];
83         if (!s) {
84             s = Object.create(original_symbol);
85             s.id = s.value = id;
86             symbol_table[id] = s;
87         }
88         return s;
89     };
90
91     var var_table;
92     var name_table;
93
94     var name_handler = function () {
95         var n = name_table[this.value];
96         if (!n) {
97             n = make_var(this.value);
98             var_table[this.value] = n;
99             n = new Lambda_var(n);
100             name_table[this.value] = n;
101         }
102         if (this.first) {
103             return make_app(this.first.handler(), n);
104         } else {
105             return n;
106         }
107     };
108
109     var branch_handler = function () {
110         var n = this.second.handler();
111         if (this.first) {
112             return make_app(this.first.handler(), n);
113         } else {
114             return n;
115         }
116     };
117
118     var lambda_handler = function () {
119         var body = this.second.handler();
120         var n, v;
121         while (this.first.length) {
122             n = this.first.pop().value;
123             v = var_table[n];
124             if (!v) {
125                 v = make_var(n);
126                 var_table[n] = v;
127                 name_table[n] = new Lambda_var(v);
128             }
129             body = make_lam(v, body);
130         }
131         return body;
132     };
133
134     symbol("(end)");
135     symbol("(name)").handler = name_handler;
136     symbol("let").handler = lambda_handler;
137     symbol("=").handler = branch_handler;
138     symbol("in");
139     symbol(")").handler = branch_handler;
140     symbol("(");
141     symbol("\\").handler = lambda_handler;
142     symbol("lambda").handler = lambda_handler;
143     symbol(".");
144
145         function make_constants() {
146
147                 function make_lam2(a, b, aa) {
148                         return make_lam(a, make_lam(b, aa));
149                 }
150                 function make_lam3(a, b, c, aa) {
151                         return make_lam(a, make_lam(b, make_lam(c, aa)));
152                 }
153                 function make_app3(aa, bb, cc) {
154                         return make_app(make_app(aa, bb), cc);
155                 }
156                 var u = make_var("u");
157                 var v = make_var("v");
158                 var x = make_var("x");
159                 var s = make_var("s");
160                 var z = make_var("z");
161                 var uu = new Lambda_var(u);
162                 var vv = new Lambda_var(v);
163                 var xx = new Lambda_var(x);
164                 var ss = new Lambda_var(s);
165                 var zz = new Lambda_var(z);
166                 var_table = { u: u, v: v, x: x, s: s, z: z};
167                 name_table = {u: uu, v: vv, x: xx, s: ss, z: zz};
168                 number_table = {};
169
170                 // constants have their own id and arity = literal
171                 // numbers have id = "(number)" and arity = literal
172                 symbol("(number)").handler = function () {
173                         var n = this.value;
174                         var res = number_table[n];
175                         if (!res) {
176                                 res = zz;
177                                 while (n > 0) {
178                                         n -= 1;
179                                         res = make_app(ss, res);
180                                 }
181                                 res = make_lam2(s, z, res);
182                                 number_table[this.value] = res;
183                         }
184                         if (this.first) {
185                                 return make_app(this.first.handler(), res);
186                         } else {
187                                 return res;
188                         }
189                 }
190
191                 var constant = function (s, v) {
192                         var x = symbol(s);
193                         x.handler = function () {
194                                 this.value = symbol_table[this.id].value;
195                                 if (this.first) {
196                                         return make_app(this.first.handler(), this.value);
197                                 } else {
198                                         return this.value;
199                                 }
200                         };
201                         x.arity = "literal";
202                         x.value = v;
203                         return x;
204                 };
205
206                 constant("S", make_lam3(u, v, x, make_app3(uu, xx, make_app(vv, xx))));
207                 constant("K", make_lam2(u, v, uu));
208                 constant("I", make_lam(x, xx));
209                 constant("B", make_lam3(u, v, x, make_app(uu, make_app(vv, xx))));
210                 constant("C", make_lam3(u, v, x, make_app3(uu, xx, vv)));
211
212                 // trush \uv.vu = CI
213                 constant("T", make_lam2(u, v, make_app(vv, uu)));
214                 // mockingbird \u.uu = SII
215                 constant("M", make_lam(u, make_app(uu, uu)));
216                 // warbler \uv.uvv = C(BM(BBT) = C(BS(C(BBI)I))I
217                 constant("W", make_lam2(u, v, make_app3(uu, vv, vv)));
218                 // lark \uv.u(vv) = CBM = BWB
219                 constant("L", make_lam2(u, v, make_app(uu, make_app(vv, vv))));
220                 // Y is SLL
221
222         }
223         make_constants();
224
225     var expression = function (in_let) {
226         var t, n;
227         if (token.id === "\\" || token.id === "lambda") {
228             token.value = "lambda";
229             t = token;
230             advance();
231             n = token;
232             if (n.arity !== "name") {
233                 n.error("Expected a variable name.");
234             }
235             advance();
236             if (token.id === "(") {
237                 t.first = [n];
238                 advance();
239                 t.second = expression(false);
240                 advance(")");
241                 return t;
242             } else {
243                 t.first = [];
244                 while (token.arity === "name" || token.id === "\\") {
245                     if (token.id !== "\\") {
246                       t.first.push(n);
247                       n = token;
248                     }
249                     advance();
250                 }
251                                 if (token.arity === "literal" && t.first.length === 0) {
252                                         t.first.push(n);
253                                         t.second = token;
254                                         advance();
255                                 } else if (token.id === ".") {
256                     t.first.push(n);
257                     advance();
258                     t.second = expression(in_let);
259                 } else if (t.first.length === 1) {
260                     t.second = n;
261                 } else {
262                     t.first.push(n);
263                     t.error("Can't parse lambda abstract.");
264                 }
265                 return t;
266             }
267         } else {
268             n = null;
269             while (token.id === "(") {
270                 advance();
271                 t = expression(false);
272                 token.first = n;
273                 token.second = t;
274                 n = token;
275                 advance(")");
276                 if (in_let && token.id === "let" || token.id === "(end)" || token.id === ")") {
277                     return n;
278                 }
279             }
280             while (true) {
281                                 if (n && (in_let && token.id === "in" || token.id === "(end)" || token.id === ")")) {
282                     return n;
283                 } else if (token.id === "(") {
284                     advance();
285                     t = expression(false);
286                     token.first = n;
287                     token.second = t;
288                     n = token;
289                     advance(")");
290                 } else {
291                     if (token.arity !== "name" && token.arity !== "literal") {
292                         token.error("Expected a variable name or literal.");
293                     }
294                     token.first = n;
295                     n = token;
296                     advance();
297                 }
298             }
299         }
300         };
301
302     return function (source) {
303         tokens = source.tokens();
304         token_nr = 0;
305         advance();
306         
307         // let n = c in b
308         // (\n. b) c
309
310         var t = null, eq, c, base = {};
311         var target = base;
312
313         while (token.id === "let") {
314             t = token;
315             advance();
316             if (token.arity !== "name") {
317                 token.error("Expected a variable name.");
318             }
319             t.first = [token];
320             advance();
321             eq = token; // token.id === "="
322             advance("=");
323             c = expression(true);
324
325                         eq.first = t;
326                         eq.second = c;
327                         target.second = eq;
328
329 //             c.first = eq;
330 //             eq.second = t;
331 //             target.second = c;
332
333             target = t;
334             advance("in");
335         }
336     
337         target.second = expression(false);
338
339         advance("(end)");
340         return base.second;
341     };
342
343 };
344