STAP Language Measures ====================== The STAP language measures have been written by Sjoerd Eilander, though Jan Odijk reviewed them and revised some of them, especially the ones for "bijwoordelijke bepalingen". For each language measure, we explain the abbreviation and its name, specify how it has been implemented (as an Xpath query, as an Xpath query with macros, or as a Python function), and mention the section and the page where the measure is described in [van Ierland et al. 2008]. We also cite from the documentation to indicate which aspect of the documentation a particular part of the query implements. S001: NS -------- * **Name** NS: "nevenschikking" = coordination * **Implementation**: Xpath query. * **Section:** 8.1 * **Page:** 50 It identifies * nodes for the words *en*, *maar*, *want*, *of* or *dus* ("Nevenschikking wordt gescoord wanneer het kind twee hoofd- of bijzinnen verbindt door een nevenschikkend voegwoord: *en*, *maar*, *want*, *of* of *dus*, in VU met en zonder samentrekking.") * with grammatical relation *crd* (coordinator) and with a sibling node that bears the relation *cnj* (conjunct) and that has a clausal category ("Nevenschikking tussen woorden en woordgroepen wordt niet gescoord"): * smain - main clause * cp - subordinate clause introduced by a subordinating conjunction * rel - relative clause * ssub - subordinate clause * sv1 - verb initial clause * whq - main clause wh-question * whrel - wh-relative clause including free relative clauses * whsub - subordinate wh-question * or with grammatical relation *dlink* - this for cases where a coordinator introduces a single clause, e.g. **en** *op de teefee mag het*, **maar** wat is Maria?*. ("Nevenschikking wordt ook gescoord wanneer een nevenschikkend voegwoord gebruikt is aan het begin van een hoofdzin die het begin van de beurt is, ook als een interjectie voorafgaat.") S002: OS -------- * **Name** OS: "onderschikking" = subordination * **Implementation**: Xpath query. * **Section:** 8.2 * **Page:** 50 It identifies: * nodes with a subordinate clausal category: *cp*, *whrel*, *whsub*, *rel*. ("Onderschikking wordt gescoord wanneer een kind een bijzin gebruikt als onderdeel van een hoofdzin. Om als Onderschikking te tellen, moet tenminste * óf het onderschikkend voegwoord of een ander verbindingswoord aanwezig zijn; * óf de bijzins-woordvolgorde gerealiseerd zijn") * a node with category ssub if at least it does not have any of the grammatical relations *body*, *cnj*, *tag* or *nucl*, in which cases it is an independent or conjunct *ssub* or covered by a clausal category immediately dominating *ssub* (*body*). Other relevant cases: * "Directe rede-zinnen worden niet gescoord bij Onderschikking": automatically taken care of since these are analysed by Alpino as main clauses. * "Wanneer twee onderschikkende zinnen nevenschikkend verbonden zijn, wordt slechts éénmaal Onderschikking gescoord én eenmaal Nevenschikking. ". Achieved by excluding *cnj* as a relation. **Remark** Cases with *tag*, *nucl*, *sat* and *mod* should be reconsidered: they usually occur in complex combinations of subordinate clauses where one should be counted and one should not (because of a superordinate cp). **Remark** *dp*, *mod* and *vc* also occur as relations (in Lassy-Small, not in STAP samples so far) and should be counted in (as they currently are) **Remark** Maybe cat = sv1 with appropriate grammatical relations for subordinate clauses (e.g. rel = mod) and with a clausal node as parent should be added here, though it may be difficult to exclude parentheticals (e.g. "zie pag. 3") S003: PV -------- * **Name** PV: "persoonsvorm" = finite verb * **Implementation**: Xpath query. * **Section:** 8.3 * **Page:** 51 It identifies nodes with the attribute *wvorm* set to "pv". Concerning: * "Bij deze variabele worden VU waarbij het kind minder of meer dan één persoonsvorm gebruikt, gescoord." * "Bij de scoring wordt uitgegaan van 50 persoonsvormen. De VU met -1 moeten van 50 worden afgetrokken en de persoonsvormen die aangegeven zijn met +1, +2, etc. moeten weer bij dit getal worden opgeteld." The results of the query for S003 are used in the computation of the relevant cells in the STAP form. See :ref:`STAP-form` S004: SGG --------- * **Name** SGG: "Samengesteld Gezegde" = composite predicate * **Implementation**: Xpath query. * **Section:** 8.4 * **Page:** 52 "Een Samengesteld gezegde wordt gescoord, wanneer een kind naast de persoonsvorm nog een werkwoord gebruikt in dezelfde hoofd- of bijzin of in een toegevoegde beknopte bijzin." The query identifies nodes * for finite verbs (wvorm=pv) with grammatical relation *hd* (Head) * that have a sibling node with grammatical relation *vc* (verbal complement) and * one of the grammatical categories *inf* (infinitival clause), *ti* (*te*-infinitival clause), or *ppart* (participial clause) * or a bare verb (pt = ww) A bare verb must be allowed for cases in which the superordinate verb has no argument (subject, direct object or indirect object) to serve as an antecedent for the subject of the nonfinite verb, e.g. *moet oefenen .*) The STAP-Handleiding distinguishes several subcases: * "Hulpwerkwoord + voltooid deelwoord.": covered by *ppart* and bare verb * "Hulpwerkwoord + infinitief (zonder te)": covered by *inf* and bare verb * "Hulpwerkwoord + (meestal) *te* of *aan het* --- + infinitief": *te* plus infinitive covered by *ti*, *aan het* plus infinitive is lacking and should be added (*ahi*) * "Hoofdwerkwoord + (om) te + infinitief": *te* plus infinitive covered, *om te* plus infinitive is lacking, should be added (vc/oti). I am not sure that the example given (*ik doe dat om te winnen natuurlijk* is a correct example, I would analyse the *om te* infinitive here as an adverbial clause. A better example would be *ik heb geprobeerd om te winnen*". * "Ook combinaties van deze soorten komen voor in één zin. Dit telt als één Samengesteld gezegde": covered if they involve coordination, as in the example given. * "Voor scoring van Samengesteld gezegde is noodzakelijk dat twee werkwoorden volledig gerealiseerd zijn. Wanneer alleen een deel van een scheidbaar zelfstandig werkwoord gerealiseerd is, telt dit niet als Samengesteld gezegde. Voorbeeld: k.ik heb het op/": covered. S005: VT -------- * **Name** VT: "Verleden Tijd" = past tense * **Implementation**: Xpath query. * **Section:** 8.5 * **Page:** 53 It identifies nodes for verbs in past tense (pvtijd=verl). The *Handleiding* states: * "Iedere Verleden tijd wordt gescoord, zowel correcte als incorrecte vormen, omdat beide soorten wijzen op morfologische activiteit van het kind: correct past tenses are covered, incorrect past tenses only if SASTA can correct it to a correct past tense. If the correct past tense is indicated by means of a CHAT annotation, e.g., *slaapten [: sliepen]*, then it can be counted as well, but this has not been implemented yet. * "Een foute Verleden tijd, die reeds gescoord is bij Ongrammaticaliteit wordt hier dus weer gescoord.": see previous bullet S006: VD -------- * **Name** VD: "Voltooid Deelword" = perfect participle * **Implementation**: Xpath query. * **Section:** 8.6 * **Page:** 54 It identifies nodes for perfect participles (wvorm=vd) The *Handleiding* states: * "Alle Voltooide deelwoorden worden gescoord, zowel correcte als incorrecte, omdat beide vormen wijzen op morfologische activiteit van het kind.". For incorrect past participles, see the remarks on incorrect past tenses. * "Een Voltooid deelwoord dat functioneert als naamwoordelijk deel van het gezegde of als bijvoeglijke bepaling, wordt ook meegeteld.": covered * "In een VU kunnen meerdere Voltooid deelwoorden voorkomen": covered S007: N ------- * **Name** N: "Naamwoord" = noun * **Implementation**: Xpath query. * **Section:** 8.7 * **Page:** 54 It identifies nodes * that are either a noun (pt=n) ("Zelfstandige naamwoorden en eigennamen") * or a substantivised adjective (pt=adj and @positie=nom) ("Zelfstandig gebruikte bijvoeglijke naamwoorden") * or that are a numeral (pt=tw) but not a determiner (rel != det) ("Zelfstandig gebruikte telwoorden") * or that are multiword units (cat = mwu) for a name (pos = name) ("Eigennamen die bestaan uit een voornaam en achternaam zijn als één Naamwoord gescoord.") The "Handleiding" also states: "Maar eigennamen met een naamwoordelijke specificatie zijn geteld als twee Naamwoorden", and that is covered. S008: BvBep ----------- * **Name** BvBep: "Bijvoeglijke Bepaling" = attributive adjunct * **Implementation**: Xpath query with macros * **Section:** 8.8 * **Page:** 55 The query is defined as ``//node[%bijvbep%]``, where the definition of the macro *bijvbep* uses many other macros:: bijvbep = """( (%corebijvbep% or %onbepvnwmod% or %twdet% or %apdet% or %app% or %detn% or %detnp% or %possdetp%) and not(%adjmodwwBB%))""" The explanation for the macros used is as follow: * **corebijvbep** = * nodes with rel = mod * but not adverbs or adverbial phrases * not relative clauses * with as parent a node with cat= np that * does not contain a head with lcat = ap. It is unclear to me what is intended here. Perhaps an attempt to exclude substantivised adjectives? * **onbepvnwmod**: nodes for indefinite pronouns with rel = det (e.g. **elke** *dag*) * **twdet**: nodes for numerals with rel = det (e.g. **drie** *boeken*) * **apdet**: nodes for aps with rel = det (e.g. **heel veel** *vaders*) * **app**: nodes for np appositions, e.g *lapje* **zwarte stof**)@@no this is a mod@@ * **detn**: nodes for noun determiners, e.g. **Wims** *huis* * **detnp**: nodes for np determiners, e.g., **een heleboel** *mensen* * **possdetp**: nodes for detps consisting of a modifiers noun and a possessive pronoun, e.g. **Anna d'r** *schoenen* * **adjmodwwBB**: nodes for uninflected adjectives or aps with an uninflected adjective as head that are modifiers to a verb (e.g. **hard** *praten*) should not be included The *Handleiding* states: * Als Bijvoeglijke bepaling worden opgevat attributief gebruikte bijvoeglijke naamwoorden of equivalenten daarvan. Een bijvoeglijk naamwoord dat naamwoordelijk deel van het gezegde is, is predikatief gebruikt en wordt niet gescoord, omdat de variabele Bijvoeglijke bepaling de complexiteit van de naamwoordgroep meet." This is covered by the requirement that the parent must be an *np*. It distinguishes: * "Bijvoeglijke naamwoorden, eventueel gecombineerd met een bijwoord van graad." covered by **corebijbep**. It states that "Meerdere bijvoeglijke naamwoorden na elkaar, gelden als één bijvoeglijke bepaling.", but the example given concerns an adverb + an adjective (*een verschrikkelijk ouwe boot*). Two attributive adjectives will currently count as 2 "bijvoeglijke naamwoorden". This may have to be changed. * "bijwoord van graad en bijv.nw.: één bijvoeglijke bepaling". covered * *Bijvoeglijk gebruikte telwoorden*. Covered. But the example **twaalf** *uur 's nachts* is currently NOT covered (because "twaalf uur" is analyzed by Alpino as an *mwu* with two *mwp* parts. In the example *de* **laatste** *aflevering*, *laatste* is not considered a numeral but an adjective, and thus covered. In the final example **geen** *spijkertjes*, *geen* is not considered a numeral by Alpino but a determiner (vnw with relation *det*). * "Bijvoeglijk gebruikte vragende voornaamwoorden": covered by **onbepvnwmod**, e.g. *welke dag* (no example given in the *Handleiding*) * "Bijvoeglijk gebruikte onbepaalde voornaamwoorden": covered by **onbepvnwmod** (**iedere** *dag*) and by **apdet** (**heel veel** *vaders*), and by *detnp* (e.g. **een heleboel** *vaders*) * "Bijvoeglijk gebruikte voorzetselgroepen." Currently NOT covered (example: *een slaapkamertje* **van mijn broer**) * "Bijvoeglijk gebruikte zelfstandige naamwoorden": covered by **app** (*een soort* **motortje**, *een stuk* **eiland**). The *Handleiding* also gives *allemaal* as a "bijvoeglijke bepaling" to *water* in *nou eerst een stuk eiland en daar om allemaal water*, but that is a wrong analysis. "allemaal"is a separate word group here, acting as a secondary predicate. It does not form a single constituent with *water*. * "Bijstellingen". No examples given. If äppositions"is meant, the they are covered by **app** Explicitly excluded are: * "Bijvoeglijke aanwijzende voornaamwoorden" * "bezittelijke voornaamwoorden" and neither of them is covered, but possessive nouns and noun phrases are included in the query (by **detn** and **possdet**) though the *Handleiding* is silent about them. @@Should they be included@@? S009: zelfst.vnw. ----------------- * **Name** zelfst.vnw.: "Zelfstandig voornaamwoord derde persoon" = independent 3rd person pronoun * **Implementation**: Xpath query with macros * **Section:** 8.9 * **Page:** 56 It identifies nodes for pronouns (pt = vnw) * that are not possessive pronouns (not(vwtype= bez)) * that are 3rd person (all the conditions on the attribute *persoon* * with attribute pos not equal to *adv* (this excludes R-pronouns) * and with *rel* not equal to *det* (because then they would be determiners, not independent pronouns) The *Handleiding* states: * "Deze variabele omvat alle zelfstandige voornaamwoorden 3e persoon" * "die geen deel uitmaken van een voorzetselgroep": this is currently NOT excluded. The *Handleiding* includes: * "Persoonlijke voornaamwoorden van de derde persoon" covered * "Zelfstandige aanwijzende voornaamwoorden": covered * "Zelfstandige onbepaalde voornaamwoorden": covered * "Zelfstandige vragende voornaamwoorden": covered * "Zelfstandig gebruikt geen (met er ervoor)": covered * "Betrekkelijk voornaamwoord met ingesloten antecedent": covered. * but it excludes some that are currently NOT excluded, i.e., "woorden die fungeren als voorlopig, herhaald of loos onderwerp of voorwerp": * **het** *had niet geregend* ("loos onderwerp"): NOT currently excluded. It can be covered by taking into account the *frame* attribute, e..g for *regenen*: *verb(hebben,sg3,* **het_subj** *)*, and by excluding the relation *sup* (e.g. **het** *is duidelijk dat hij ziek is*) * "loos voorwerp": not excluded, but it can be covered by excluding the relation *pobj1* (as in *ik waardeer* **het** *dat hij komt*) * "herhaald onderwerp": not excluded, some may be excluded because they are analyzed as relative pronouns, otherwise we have to look at satellite/nucleus configurations S010: BB p ----------- * **Name** BB p: "Bijwoordelijke Bepaling van Plaats" = locative adverbial modifier * **Implementation**: Xpath query with macros * **Section:** 8.10 * **Page:** 59 The query is ``//node[%new_STAP_BB_p%]`` where the macro *new_STAP_BB_p* is defined as:: new_STAP_BB_p = """ ( (%ld_pp% or %ld_vz% or %ld_erlocadv% or %loc_ppBB% or %locadvBB% or %locadvpBB% or %predclocadj% or %predclocap% or %svp_bw% or %loc_vzBB% or %mod_Rpronoun% ) and not(%new_STAP_BB_t%) and %STAP_geen_BB% ) """ We will discuss each of the parts of this macro: * **ld_pp**: for pp's with the relation *ld*, e.g. *toen ik klaar was toen gingen we* **naar oma**, *die is nu* **op school**, *toen waren jullie* **in Turkije** *op vakantie* * **ld_vz**: for adpositions with relation *ld*, e.g. *en dan als je* **beneden** *komt* * **ld_erlocadv**: for locative adverbs including R-adverbs with relation *ld*. Locative adverbs (macro *locadv*) are identified by the value of the attribute *frame* (must be *er_loc_adverb* or *loc_adverb*, or *er_adverb(P)*, where *P* is one of the (nonambiguous) locative adpositions (for locative adverbial pronouns), e.g. *hij heeft hem* **eruit** *gehaald*. * **loc_ppBB**: for pp's that are adverbial modifiers and have a locative adposition as their head. The notion "locative adposition" is defined by the macro **loc_vz**, which simply gives a list of these adpositions. The notion "adverbial modifier" is defined by the macro **BB**: * **BB**: a phrase is an adverbial modifier if it bears one of the grammatical relations *mod*, *dp*, *--*, *nucl*, *whd* and, either the parent node is (not non)clausal or it is a node for an uninflected adjective or ap with an uninflected adjective as head that is a modifier to a verb (e.g. **hard** *praten*), see *adjmodwwBB* above. * **locadvBB**: for adverbs with relation *ld*, and for locative adverbs that are adverbial modifiers. Locative adverbs are identified as above (macro **locadv**). Examples: *mag je* **daar** *filmpjes kijken.*, *dan gaat ie zelf* **achteruit**, *die is* **thuis** *?* * **locadvpBB**: for adverbial phrases with a locative adverb as the head, e.g. *Maar bij het laatste nachtje sliep ik* **helemaal beneden** . * **predclocadj**: for predicative locative adjectives, e.g *ik kan het gas niet* **hoger** zetten, *mag ik* **hoger** *zitten* * **predclocap**: for predicative aps with a locative adjective as head, e.g., *mag ik* **veel hoger** *zitten?* * **svp_bw**: for adverbs that function as an *svp*, e.g. *tasje doen we* **weg**, *kom je dan* **terug**. **Remark**: we should exclude *samen*, and *genoeg*. * **loc_vzBB**: for locative adpositions functioning as an adverbial modifier. This is mainly for locative adpositions that could not be integrated into the structure, as e.g., in **op** *mijn eigen* * **mod_Rpronoun**: for R-pronouns functioning as a modifier. The macro simply lists all R-pronouns and requires them to have the *mod* relation * **new_STAP_BB_t**: it should not be a temporal adverbial modifier. See section :ref:`BBT` * **STAP_geen_BB**: some frequent adverbs should be excluded (see below), which is done with this macro The *Handleiding* states: * "Als bijwoordelijke bepaling worden alle bijwoordelijke bepalingen die zelfstandig zinsdeel zijn én bepalingen van gesteldheid gescoord. De bijwoordelijke bepalingen kunnen voorkomen in de vorm van voorzetselgroepen en in de vorm van losse bijwoorden of bijwoordcombinaties, met uitzondering van een klein aantal zeer frequente bijwoorden." * "Niet gescoord als Bijwoordelijke bepalingen: *al meer toch dan niet toen dus nog weer eens nou nu wel gewoon ook zo maar te*. Deze bijwoorden worden als ze voorkomen als losse Bijwoordelijke bepaling niet gescoord, omdat ze heel stereotiep gebruikt kunnen worden en ze geen wezenlijke uitbreiding van de zin vormen. Ze worden wel gescoord als ze onderdeel van een woordgroep zijn." Though there is a macro **STAP_geen_BB** to take this into account, it is currently incorrectly not used in the query definitions. This should be added. * "Wel gescoord als Bijwoordelijke bepalingen": *die vond* **zo lekker** **op de grond** zitten*: * "*zo*: onderdeel van een woordgroep *zo lekker*, die samen een bepaling van gesteldheid vormt, telt als één bijwoordelijke bepaling;" * *op de grond*: voorzetselgroep die een bijwoordelijke bepaling is." Covered by **locppBB** and by **ld_pp**. * "Scheidbare delen van samengestelde werkwoorden die de vorm hebben van een voorzetsel (*hij ruimt het huis op*) worden niet als bijwoordelijke bepaling geteld; wel delen die de vorm hebben van een bijvoeglijk naamwoord (*hij maakt het huis schoon*) of van een bijwoord (*hij gooit de rommel weg*)." Adverbs are covered by **svp_bw** but adjectives are not covered yet. * "In één VU kunnen meerdere bijwoordelijke bepalingen voorkomen die gescoord moeten worden. Opeenvolgende bijwoorden worden, voor zover (semantisch) mogelijk, samen genomen en beschouwd als één bijwoordelijke bepaling.". Covered where Alpino can integrate successive adverbs into one constituent. More specifically on "Bijwoordelijke bepalingen van plaats". It includes: * "Bijwoordelijke bepalingen van plaats, richting en oorsprong." covered * "Ook de vragende bijwoorden van plaats en richting (*waar*, *waarin*, *waarheen*, *waarnaar*, etc) worden hier gescoord." Covered by **ld_erlocadv** * Other examples: * *en dan gaat ie* **in zo'n soort fabriek**: covered by **ld_pp** * *we zijn* **op de camping**: covered by **ld_pp** * **daar** *is een zwembad*: covered by **ld_erlocadv** * *en dan gaan we* **daar naar heen**: * *want nou ga ik morgen ook* **naar m'n vriendje van de camping**: covered by **ld_pp** * *want die woont* **daar** nu **in Grouw**: covered by **locadvBB** and by **ld_pp**. * *gaan we* **daarheen**: covered by **ld_erlocadv** * *en toen ging hij* **dwars door de ruit heen**: covered by **ld_pp** * "de vet gedrukte opeenvolgende woorden passen semantisch bij elkaar: één Bijwoordelijke bepaling van plaats.": covered .. _BBT: S011: BB t ---------- * **Name** BB t: "Bijwoordelijke Bepaling van Tijd" = temporal adverbial modifier * **Implementation**: Xpath query with macros * **Page:** 59 The query is defined as //node[%new_STAP_BB_t%], where the macro *new_STAP_BB_t* is defined as follows:: new_STAP_BB_t = """ (( %advBBt% or %advpBBt% or %npBBt% or %apBBt% or %adjBBt% or %ppnpBBt% or %geledenBBt% or %temporal_mwu% ) and %STAP_geen_BB%) """ We discuss each of the macros used inside this query * **advBBt** searches for adverbs (*bw*) that are adverbial modifiers (**BB**, see above) and that meet the requirements of the **temp** macro. The macro **temp** identifies temporal adverbs by frame properties of the word (**tempadv**) or the lemma (**templemma**) while avoiding excludedlemmas (**excludedlemma**): * **tempadv** simply checks for values of the *frame* attribute (*tmp_adverb*, *wh_tmp_adverb*) and the *special* attribute (*tmp*) * **templemma** simply lists some lemmas for which the frame or special attribute does not indicate the temporal character of the word, among them pronominal adverbs with the adposition *na* (macro **Rna**). * **excludedlemma** simply lists lemmas that should not be included as a temporal adverb. It probably should be replaced by the macro **STAP_geen_BB** * **advpBBt** is defined as:: advpBBt = """ (@cat="advp" and %BB% and node[@rel="hd" and %temp% ])""" so it searches for adverb phrase (*advp*) that are adverbial modifiers (**BB**, see above) and that have a head that meets the conditions of the macro **temp**. * **npBBt** is defined as:: npBBt = """ (@cat="np" and %BB% and node[@rel="hd" and %tempnoun%])""" so it searches for noun phrases that are adverbial modifiers and have a head that meets the condition of the macro **tempnoun**: * **tempnoun** checks the temporal character of a noun by checking its *frame* attribute or by inspecting the value of the *lemma* attribute. In the latter case a disjunction of lemmas for event nouns is given, currently very incomplete. This is probably better replaced by a function in the *generatemacros* module, where the event nouns are extracted from an external source. * **adjBBt** searches for adjectives with grammatical relation *mod* outside of an NP (macro **notinNP**) that meet the conditions of macro **tempadj**. The latter macro checks for the values of the attributes *frame* and *special*, or for specific lemmas (currently only 1). * **apBBt** searches for APs with grammatical relation *mod* and with a head that meets the requirements of the macro *tempadj*. There is no condition that the AP should not be inside an NP, but that probably has to be added. * **ppnpBBt** searches for PPs that are adverbial modifiers (via the macro **BB**) or have the grammatical relation *ld* and: * either have a temporal adposition as its head, as determined by the macro **tempvz**, which simply is a disjunction of words or lemmas that are unambiguously temporal; * or have an NP complement with a head noun that is temporal, as determined by the macro **hastempnounhead** * or have a noun complement that is temporal as determined by the macro **tempnoun** * or have *mwu* as complement one part of which is a temporal noun (e.g. *'s avonds*) * **geledenBBt** searches for past participial phrases (*ppart*) that are adverbial modifiers (via macro **BB**) and that have a head with lemma equal to *geleden* * **temporal_mwu** searches for phrases that were tagged by Alpino as a multiword expression (MWU in Dutch, for "meerwoordsuiting") but denote a temporal adverbial, such as *'s avonds* 'in the evening', by searching for mwus containing a temporal noun. Temporal nouns are defined as follows:: tempnoun = """ (@special="tmp" or starts-with(@frame, "tmp_noun") or starts-with(@frame, "tmp_np") or %tempnounlemma%)""" in which **tempnounlemma** is an exhaustive list of temporal lemmas * **STAP_geen_BB** excludes frequent adverbs. See s010 above. The *Handleiding* states: "Deze variabele omvat Bijwoordelijke bepalingen van tijd, van duur, van frequentie en alles wat verwant is aan tijd. Ook de vragende bijwoorden van tijd (*wanneer*, *hoe lang*, etc) worden hier gescoord. It provides the example: * *ja,* **volgende week** *ga ik verhuizen, als ik* **al lang** *vijf jaar ben* of which it states: "In deze VU met een hoofdzin en een bijzin staan twee Bijwoordelijke bepalingen van tijd;". These are the boldfaced phrases "volgende week" (covered) and "al lang" (covered). "de bijwoordelijke bijzin van tijd wordt niet apart als Bijwoordelijke bepaling van tijd geteld." (covered). There are also the examples: * en toen ging m'n papa me optillen/ * en toen ging ik **'s avonds** op m'n papa z'n nek staan * en toen ging ik eraf springen en m'n moeder **ook een keer** Also *ook een keer* is not covered because Alpino analyses the NP as a modifier of the noun *moeder*. S012: BB o ---------- * **Name** BB t: "Overige Bijwoordelijke Bepaling" = other adverbial modifier * **Implementation**: Xpath query with macros * **Page:** 60 The query is defined as `//node[%new_STAP_BB_o%]` where the macro **new_STAP_BB_o** is defined as follows:: new_STAP_BB_o = """ (( %bbo_pt% or %bbo_cat% or %bbo_mwu%) and not(%excludedadverb%) and (%BB% or %pred% or %svp_bbo%) and not(%new_STAP_BB_t%) and not(%new_STAP_BB_p%) and %STAP_geen_BB% ) """ We discuss each of the aspsects of this macro: * **bbo_pt**: any node with a value for the *pt* attribute that can function as an adverbial modifier * **bbo_cat**: any node with a value for the *cat* attribute that can function as an adverbial modifier * **bbo_mwu**: any node with *cat* equal to "mwu* and containing a node that meets the requirements of the macro **bbo_pt** * **excludedadverb**: this identifies the adverbs that should not be scored as an adverbial modifier (doubled by **STAP_geen_BB**) * **BB**: functioning as an adverbial modifier * **pred**: this identifies phrases functioning as a secondary predicate, denoted *predc* or *predm* by Alpino. However, *predc* also indicates main predicates, which are excluded by requiring the phrase not to be a sister to a copula in the syntactic structure. Copulae are identified by having the *hd* relation, and (because Alpino does not distinguish between main verbs, modal verbs and copulae) having the POS *ww* and the lemma of one of the classic Dutch copulae: *zijn, worden, blijven, lijken, blijken, schijnen, dunken, heten, voorkomen* * **svp_bbo**: functioning as an *svp* (by the macro **svp_bbo**, which also requires *pt* to be equal to *adj* or *bw*, and allows a word with a specific *lemma* * **not(%new_STAP_BB_t%)**: it should not be a temporal adverbial modifier * **not(%new_STAP_BB_p%)**: it should not be a locative adverbial modifier The *Handleiding* states: "De Overige bijwoordelijke bepalingen omvatten:" * "Bijwoordelijke bepalingen met een andere functie dan plaats of tijd;": covered * "De overige vragende bijwoorden (*waarom*, *hoe*, etc) worden hier ook gescoord.": covered * "Bepalingen van gesteldheid.": covered * Examples: * *en nu is ie weg* **met de vuilnisauto**: covered * *en* **als het dan mooi weer is**, dan gaan we **met Dennis** *buiten voetballen* (not covered, Alpino parses *met Dennis* as a *pc*, not as a *mod*). Maybe we should include pc/PPs with *met* as head as well. * *en dat vind ik* **zo leuk**: covered .. _STAP-form: S019: Form ----------- @@to add@@