ó
    <±hŠ©  ã                   ór  • S r SSKrSSKJrJrJr  SSKrSSKrSSKJr  SSK	J
r
JrJr  SSKJr  SSKJr  SS	KJrJrJrJrJrJr  SS
KJrJrJrJrJr  SSKJrJ r J!r!  SSK"J#r#  \!RH                  " \%5      r& " S S\RN                  5      r(S@S jr) " S S\RN                  5      r* " S S\RN                  5      r+ " S S\RN                  5      r, " S S\RN                  5      r- " S S\RN                  5      r. " S S\RN                  5      r/ " S S\RN                  5      r0 " S S \RN                  5      r1  SAS!\RN                  S"\Rd                  S#\Rd                  S$\Rd                  S%\\Rd                     S&\3S'\3S(\\Rd                     4S) jjr4 " S* S+\RN                  5      r5 " S, S-\RN                  5      r6 " S. S/\5      r7 " S0 S1\RN                  5      r8\ " S2 S3\5      5       r9\ " S4 S5\95      5       r:\ " S6 S7\95      5       r;\" S8S99 " S: S;\95      5       r<\" S<S99 " S= S>\95      5       r=/ S?Qr>g)BzPyTorch MarkupLM model.é    N)ÚCallableÚOptionalÚUnion)Únn)ÚBCEWithLogitsLossÚCrossEntropyLossÚMSELossé   )ÚACT2FN)ÚGradientCheckpointingLayer)ÚBaseModelOutputÚBaseModelOutputWithPoolingÚMaskedLMOutputÚQuestionAnsweringModelOutputÚSequenceClassifierOutputÚTokenClassifierOutput)ÚALL_ATTENTION_FUNCTIONSÚPreTrainedModelÚapply_chunking_to_forwardÚ find_pruneable_heads_and_indicesÚprune_linear_layer)Úauto_docstringÚcan_return_tupleÚloggingé   )ÚMarkupLMConfigc                   ó6   ^ • \ rS rSrSrU 4S jrSS jrSrU =r$ )ÚXPathEmbeddingsé1   z€Construct the embeddings from xpath tags and subscripts.

We drop tree-id in this version, as its info can be covered by xpath.
c           	      óÒ  >• [         TU ]  5         UR                  U l        [        R                  " UR
                  U R                  -  UR                  5      U l        [        R                  " UR                  5      U l
        [        R                  " 5       U l        [        R                  " UR
                  U R                  -  SUR                  -  5      U l        [        R                  " SUR                  -  UR                  5      U l        [        R                  " [!        U R                  5       Vs/ sH.  n[        R"                  " UR$                  UR
                  5      PM0     sn5      U l        [        R                  " [!        U R                  5       Vs/ sH.  n[        R"                  " UR(                  UR
                  5      PM0     sn5      U l        g s  snf s  snf )Né   )ÚsuperÚ__init__Ú	max_depthr   ÚLinearÚxpath_unit_hidden_sizeÚhidden_sizeÚxpath_unitseq2_embeddingsÚDropoutÚhidden_dropout_probÚdropoutÚReLUÚ
activationÚxpath_unitseq2_innerÚ	inner2embÚ
ModuleListÚrangeÚ	EmbeddingÚmax_xpath_tag_unit_embeddingsÚxpath_tag_sub_embeddingsÚmax_xpath_subs_unit_embeddingsÚxpath_subs_sub_embeddings)ÚselfÚconfigÚ_Ú	__class__s      €Úf/var/www/html/shao/venv/lib/python3.13/site-packages/transformers/models/markuplm/modeling_markuplm.pyr#   ÚXPathEmbeddings.__init__7   sd  ø€ Ü‰ÑÔØ×)Ñ)ˆŒä)+¯ª°6×3PÑ3PÐSW×SaÑSaÑ3aÐci×cuÑcuÓ)vˆÔ&ä—z’z &×"<Ñ"<Ó=ˆŒäŸ'š'›)ˆŒÜ$&§I¢I¨f×.KÑ.KÈdÏnÉnÑ.\Ð^_Ðbh×btÑbtÑ^tÓ$uˆÔ!ÜŸš 1 v×'9Ñ'9Ñ#9¸6×;MÑ;MÓNˆŒä(*¯ªô ˜tŸ~™~Ô.óá.Aô —’˜V×AÑAÀ6×C`ÑC`ÖaÙ.ñó)
ˆÔ%ô *,¯ªô ˜tŸ~™~Ô.óá.Aô —’˜V×BÑBÀF×DaÑDaÖbÙ.ñó*
ˆÕ&ùòùòs   Ä74GÆ4G$c           	      óÖ  • / n/ n[        U R                  5       H_  nUR                  U R                  U   " US S 2S S 2U4   5      5        UR                  U R                  U   " US S 2S S 2U4   5      5        Ma     [
        R                  " USS9n[
        R                  " USS9nX4-   nU R                  U R                  U R                  U R                  U5      5      5      5      nU$ )Néÿÿÿÿ©Údim)r1   r$   Úappendr4   r6   ÚtorchÚcatr/   r+   r-   r.   )r7   Úxpath_tags_seqÚxpath_subs_seqÚxpath_tags_embeddingsÚxpath_subs_embeddingsÚiÚxpath_embeddingss          r;   ÚforwardÚXPathEmbeddings.forwardQ   sÝ   € Ø "ÐØ "Ðät—~‘~Ö&ˆAØ!×(Ñ(¨×)FÑ)FÀqÒ)IÈ.ÒYZÒ\]Ð_`ÐY`ÑJaÓ)bÔcØ!×(Ñ(¨×)GÑ)GÈÒ)JÈ>ÒZ[Ò]^Ð`aÐZaÑKbÓ)cÖdñ 'ô !&§	¢	Ð*?ÀRÑ HÐÜ %§	¢	Ð*?ÀRÑ HÐà0ÑHÐàŸ>™>¨$¯,©,°t·±Àt×G`ÑG`ÐaqÓGrÓ7sÓ*tÓuÐàÐó    )r-   r+   r/   r$   r6   r4   r(   r.   )NN)	Ú__name__Ú
__module__Ú__qualname__Ú__firstlineno__Ú__doc__r#   rJ   Ú__static_attributes__Ú__classcell__©r:   s   @r;   r   r   1   s   ø† ñõ

÷4 ò  rL   r   c                 óº   • U R                  U5      R                  5       n[        R                  " USS9R	                  U5      U-   U-  nUR                  5       U-   $ )zí
Replace non-padding symbols with their position numbers. Position numbers begin at padding_idx+1. Padding symbols
are ignored. This is modified from fairseq's `utils.make_positions`.

Args:
    x: torch.Tensor x:

Returns: torch.Tensor
r   r?   )ÚneÚintrB   ÚcumsumÚtype_asÚlong)Ú	input_idsÚpadding_idxÚpast_key_values_lengthÚmaskÚincremental_indicess        r;   Ú"create_position_ids_from_input_idsr`   d   sW   € ð <‰<˜Ó$×(Ñ(Ó*€DÜ Ÿ<š<¨°!Ñ4×<Ñ<¸TÓBÐE[Ñ[Ð_cÑcÐØ×#Ñ#Ó%¨Ñ3Ð3rL   c                   óJ   ^ • \ rS rSrSrU 4S jrS r       SS jrSrU =r	$ )ÚMarkupLMEmbeddingsét   zGConstruct the embeddings from word, position and token_type embeddings.c                 óX  >• [         TU ]  5         Xl        [        R                  " UR
                  UR                  UR                  S9U l        [        R                  " UR                  UR                  5      U l
        UR                  U l        [        U5      U l        [        R                  " UR                  UR                  5      U l        [        R                   " UR                  UR"                  S9U l        [        R$                  " UR&                  5      U l        U R+                  S[,        R.                  " UR                  5      R1                  S5      SS9  UR                  U l        [        R                  " UR                  UR                  U R2                  S9U l
        g )N)r\   ©ÚepsÚposition_ids)r   r>   F)Ú
persistent)r"   r#   r8   r   r2   Ú
vocab_sizer'   Úpad_token_idÚword_embeddingsÚmax_position_embeddingsÚposition_embeddingsr$   r   rI   Útype_vocab_sizeÚtoken_type_embeddingsÚ	LayerNormÚlayer_norm_epsr)   r*   r+   Úregister_bufferrB   ÚarangeÚexpandr\   ©r7   r8   r:   s     €r;   r#   ÚMarkupLMEmbeddings.__init__w   s8  ø€ Ü‰ÑÔØŒÜ!Ÿ|š|¨F×,=Ñ,=¸v×?QÑ?QÐ_e×_rÑ_rÑsˆÔÜ#%§<¢<°×0NÑ0NÐPV×PbÑPbÓ#cˆÔ à×)Ñ)ˆŒä /°Ó 7ˆÔä%'§\¢\°&×2HÑ2HÈ&×J\ÑJ\Ó%]ˆÔ"äŸš f×&8Ñ&8¸f×>SÑ>SÑTˆŒÜ—z’z &×"<Ñ"<Ó=ˆŒà×ÑØœEŸLšL¨×)GÑ)GÓH×OÑOÐPWÓXÐejð 	ñ 	
ð "×.Ñ.ˆÔÜ#%§<¢<Ø×*Ñ*¨F×,>Ñ,>ÈD×L\ÑL\ñ$
ˆÕ rL   c                 ó  • UR                  5       SS nUS   n[        R                  " U R                  S-   X0R                  -   S-   [        R                  UR
                  S9nUR                  S5      R                  U5      $ )z¯
We are provided embeddings directly. We cannot infer which are padded so just generate sequential position ids.

Args:
    inputs_embeds: torch.Tensor

Returns: torch.Tensor
Nr>   r   ©ÚdtypeÚdevicer   )ÚsizerB   rs   r\   rZ   rz   Ú	unsqueezert   )r7   Úinputs_embedsÚinput_shapeÚsequence_lengthrg   s        r;   Ú&create_position_ids_from_inputs_embedsÚ9MarkupLMEmbeddings.create_position_ids_from_inputs_embeds   s~   € ð $×(Ñ(Ó*¨3¨BÐ/ˆØ% a™.ˆä—|’|Ø×Ñ˜qÑ  /×4DÑ4DÑ"DÀqÑ"HÔPU×PZÑPZÐcp×cwÑcwñ
ˆð ×%Ñ% aÓ(×/Ñ/°Ó<Ð<rL   c                 ó–  • Ub  UR                  5       nOUR                  5       S S nUb  UR                  OUR                  n	Uc+  Ub  [        XR                  U5      nOU R	                  U5      nUc$  [
        R                  " U[
        R                  U	S9nUc  U R                  U5      nUc[  U R                  R                  [
        R                  " [        [        U5      U R                  /-   5      [
        R                  U	S9-  nUc[  U R                  R                  [
        R                  " [        [        U5      U R                  /-   5      [
        R                  U	S9-  nUn
U R!                  U5      nU R#                  U5      nU R%                  X#5      nX«-   U-   U-   nU R'                  U5      nU R)                  U5      nU$ )Nr>   rx   )r{   rz   r`   r\   r€   rB   ÚzerosrZ   rk   r8   Ú
tag_pad_idÚonesÚtupleÚlistr$   Úsubs_pad_idrm   ro   rI   rp   r+   )r7   r[   rD   rE   Útoken_type_idsrg   r}   r]   r~   rz   Úwords_embeddingsrm   ro   rI   Ú
embeddingss                  r;   rJ   ÚMarkupLMEmbeddings.forward¡   s§  € ð Ñ Ø#Ÿ.™.Ó*‰Kà'×,Ñ,Ó.¨s°Ð3ˆKà%.Ñ%:×!Ò!À×@TÑ@TˆàÑØÑ$äAÀ)×M]ÑM]Ð_uÓv‘à#×JÑJÈ=ÓYàÑ!Ü"Ÿ[š[¨¼E¿J¹JÈvÑVˆNàÑ Ø ×0Ñ0°Ó;ˆMð Ñ!Ø!Ÿ[™[×3Ñ3´e·j²jÜ”d˜;Ó'¨4¯>©>Ð*:Ñ:Ó;Ä5Ç:Á:ÐV\ñ7ñ ˆNð Ñ!Ø!Ÿ[™[×4Ñ4´u·z²zÜ”d˜;Ó'¨4¯>©>Ð*:Ñ:Ó;Ä5Ç:Á:ÐV\ñ8ñ ˆNð )ÐØ"×6Ñ6°|ÓDÐà $× :Ñ :¸>Ó JÐà×0Ñ0°ÓPÐØ%Ñ;Ð>SÑSÐVfÑfˆ
à—^‘^ JÓ/ˆ
Ø—\‘\ *Ó-ˆ
ØÐrL   )	rp   r8   r+   r$   r\   rm   ro   rk   rI   )NNNNNNr   )
rM   rN   rO   rP   rQ   r#   r€   rJ   rR   rS   rT   s   @r;   rb   rb   t   s1   ø† ÙQõ
ò2=ð& ØØØØØØ ÷2ò 2rL   rb   c                   óz   ^ • \ rS rSrU 4S jrS\R                  S\R                  S\R                  4S jrSrU =r	$ )ÚMarkupLMSelfOutputé×   c                 ó(  >• [         TU ]  5         [        R                  " UR                  UR                  5      U l        [        R                  " UR                  UR                  S9U l        [        R                  " UR                  5      U l
        g ©Nre   )r"   r#   r   r%   r'   Údenserp   rq   r)   r*   r+   ru   s     €r;   r#   ÚMarkupLMSelfOutput.__init__Ø   s`   ø€ Ü‰ÑÔÜ—Y’Y˜v×1Ñ1°6×3EÑ3EÓFˆŒ
ÜŸš f×&8Ñ&8¸f×>SÑ>SÑTˆŒÜ—z’z &×"<Ñ"<Ó=ˆrL   Úhidden_statesÚinput_tensorÚreturnc                 óp   • U R                  U5      nU R                  U5      nU R                  X-   5      nU$ ©N©r’   r+   rp   ©r7   r”   r•   s      r;   rJ   ÚMarkupLMSelfOutput.forwardÞ   ó5   € ØŸ
™
 =Ó1ˆØŸ™ ]Ó3ˆØŸ™ }Ñ'CÓDˆØÐrL   ©rp   r’   r+   ©
rM   rN   rO   rP   r#   rB   ÚTensorrJ   rR   rS   rT   s   @r;   rŽ   rŽ   ×   ó6   ø† õ>ð U§\¡\ð ÀÇÁð ÐRW×R^ÑR^÷ ò rL   rŽ   c                   ób   ^ • \ rS rSrU 4S jrS\R                  S\R                  4S jrSrU =r	$ )ÚMarkupLMIntermediateéæ   c                 ó  >• [         TU ]  5         [        R                  " UR                  UR
                  5      U l        [        UR                  [        5      (       a  [        UR                     U l        g UR                  U l        g r˜   )r"   r#   r   r%   r'   Úintermediate_sizer’   Ú
isinstanceÚ
hidden_actÚstrr   Úintermediate_act_fnru   s     €r;   r#   ÚMarkupLMIntermediate.__init__ç   s`   ø€ Ü‰ÑÔÜ—Y’Y˜v×1Ñ1°6×3KÑ3KÓLˆŒ
Üf×'Ñ'¬×-Ñ-Ü'-¨f×.?Ñ.?Ñ'@ˆDÕ$à'-×'8Ñ'8ˆDÕ$rL   r”   r–   c                 óJ   • U R                  U5      nU R                  U5      nU$ r˜   ©r’   r©   ©r7   r”   s     r;   rJ   ÚMarkupLMIntermediate.forwardï   s&   € ØŸ
™
 =Ó1ˆØ×0Ñ0°Ó?ˆØÐrL   r¬   rž   rT   s   @r;   r¢   r¢   æ   s(   ø† õ9ð U§\¡\ð °e·l±l÷ ò rL   r¢   c                   óz   ^ • \ rS rSrU 4S jrS\R                  S\R                  S\R                  4S jrSrU =r	$ )ÚMarkupLMOutputéö   c                 ó(  >• [         TU ]  5         [        R                  " UR                  UR
                  5      U l        [        R                  " UR
                  UR                  S9U l        [        R                  " UR                  5      U l        g r‘   )r"   r#   r   r%   r¥   r'   r’   rp   rq   r)   r*   r+   ru   s     €r;   r#   ÚMarkupLMOutput.__init__÷   s`   ø€ Ü‰ÑÔÜ—Y’Y˜v×7Ñ7¸×9KÑ9KÓLˆŒ
ÜŸš f×&8Ñ&8¸f×>SÑ>SÑTˆŒÜ—z’z &×"<Ñ"<Ó=ˆrL   r”   r•   r–   c                 óp   • U R                  U5      nU R                  U5      nU R                  X-   5      nU$ r˜   r™   rš   s      r;   rJ   ÚMarkupLMOutput.forwardý   rœ   rL   r   rž   rT   s   @r;   r°   r°   ö   r    rL   r°   c                   ób   ^ • \ rS rSrU 4S jrS\R                  S\R                  4S jrSrU =r	$ )ÚMarkupLMPooleri  c                 ó¶   >• [         TU ]  5         [        R                  " UR                  UR                  5      U l        [        R                  " 5       U l        g r˜   )r"   r#   r   r%   r'   r’   ÚTanhr-   ru   s     €r;   r#   ÚMarkupLMPooler.__init__  s9   ø€ Ü‰ÑÔÜ—Y’Y˜v×1Ñ1°6×3EÑ3EÓFˆŒ
ÜŸ'š'›)ˆrL   r”   r–   c                 ó\   • US S 2S4   nU R                  U5      nU R                  U5      nU$ )Nr   )r’   r-   )r7   r”   Úfirst_token_tensorÚpooled_outputs       r;   rJ   ÚMarkupLMPooler.forward  s6   € ð +ª1¨a¨4Ñ0ÐØŸ
™
Ð#5Ó6ˆØŸ™¨Ó6ˆØÐrL   )r-   r’   rž   rT   s   @r;   r·   r·     s(   ø† õ$ð
 U§\¡\ð °e·l±l÷ ò rL   r·   c                   ób   ^ • \ rS rSrU 4S jrS\R                  S\R                  4S jrSrU =r	$ )ÚMarkupLMPredictionHeadTransformi  c                 óp  >• [         TU ]  5         [        R                  " UR                  UR                  5      U l        [        UR                  [        5      (       a  [        UR                     U l
        OUR                  U l
        [        R                  " UR                  UR                  S9U l        g r‘   )r"   r#   r   r%   r'   r’   r¦   r§   r¨   r   Útransform_act_fnrp   rq   ru   s     €r;   r#   Ú(MarkupLMPredictionHeadTransform.__init__  s~   ø€ Ü‰ÑÔÜ—Y’Y˜v×1Ñ1°6×3EÑ3EÓFˆŒ
Üf×'Ñ'¬×-Ñ-Ü$*¨6×+<Ñ+<Ñ$=ˆDÕ!à$*×$5Ñ$5ˆDÔ!ÜŸš f×&8Ñ&8¸f×>SÑ>SÑTˆrL   r”   r–   c                 ól   • U R                  U5      nU R                  U5      nU R                  U5      nU$ r˜   )r’   rÂ   rp   r­   s     r;   rJ   Ú'MarkupLMPredictionHeadTransform.forward  s4   € ØŸ
™
 =Ó1ˆØ×-Ñ-¨mÓ<ˆØŸ™ }Ó5ˆØÐrL   )rp   r’   rÂ   rž   rT   s   @r;   rÀ   rÀ     s)   ø† õUð U§\¡\ð °e·l±l÷ ò rL   rÀ   c                   ó4   ^ • \ rS rSrU 4S jrS rS rSrU =r$ )ÚMarkupLMLMPredictionHeadi'  c                 óH  >• [         TU ]  5         [        U5      U l        [        R
                  " UR                  UR                  SS9U l        [        R                  " [        R                  " UR                  5      5      U l        U R                  U R                  l        g )NF)Úbias)r"   r#   rÀ   Ú	transformr   r%   r'   ri   ÚdecoderÚ	ParameterrB   rƒ   rÉ   ru   s     €r;   r#   Ú!MarkupLMLMPredictionHead.__init__(  sm   ø€ Ü‰ÑÔÜ8¸Ó@ˆŒô —y’y ×!3Ñ!3°V×5FÑ5FÈUÑSˆŒä—L’L¤§¢¨V×->Ñ->Ó!?Ó@ˆŒ	ð !ŸI™Iˆ‰ÕrL   c                 ó:   • U R                   U R                  l         g r˜   )rÉ   rË   ©r7   s    r;   Ú_tie_weightsÚ%MarkupLMLMPredictionHead._tie_weights5  s   € Ø ŸI™Iˆ‰ÕrL   c                 óJ   • U R                  U5      nU R                  U5      nU$ r˜   )rÊ   rË   r­   s     r;   rJ   Ú MarkupLMLMPredictionHead.forward8  s$   € ØŸ™ }Ó5ˆØŸ™ ]Ó3ˆØÐrL   )rÉ   rË   rÊ   )	rM   rN   rO   rP   r#   rÐ   rJ   rR   rS   rT   s   @r;   rÇ   rÇ   '  s   ø† õ&ò&÷ð rL   rÇ   c                   ób   ^ • \ rS rSrU 4S jrS\R                  S\R                  4S jrSrU =r	$ )ÚMarkupLMOnlyMLMHeadi?  c                 óB   >• [         TU ]  5         [        U5      U l        g r˜   )r"   r#   rÇ   Úpredictionsru   s     €r;   r#   ÚMarkupLMOnlyMLMHead.__init__@  s   ø€ Ü‰ÑÔÜ3°FÓ;ˆÕrL   Úsequence_outputr–   c                 ó(   • U R                  U5      nU$ r˜   ©r×   )r7   rÙ   Úprediction_scoress      r;   rJ   ÚMarkupLMOnlyMLMHead.forwardD  s   € Ø ×,Ñ,¨_Ó=ÐØ Ð rL   rÛ   rž   rT   s   @r;   rÕ   rÕ   ?  s(   ø† õ<ð! u§|¡|ð !¸¿¹÷ !ò !rL   rÕ   ÚmoduleÚqueryÚkeyÚvalueÚattention_maskÚscalingr+   Ú	head_maskc                 ó  • [         R                  " XR                  SS5      5      U-  n	Ub"  US S 2S S 2S S 2S UR                  S   24   n
Xš-   n	[        R
                  R                  U	S[         R                  S9R                  UR                  5      n	[        R
                  R                  X–U R                  S9n	Ub  X—R                  SSSS5      -  n	[         R                  " X“5      nUR                  SS5      R                  5       nX¹4$ )Né   r
   éþÿÿÿr>   )r@   ry   )ÚpÚtrainingr   )rB   ÚmatmulÚ	transposeÚshaper   Ú
functionalÚsoftmaxÚfloat32Útory   r+   ré   ÚviewÚ
contiguous)rÞ   rß   rà   rá   râ   rã   r+   rä   ÚkwargsÚattn_weightsÚcausal_maskÚattn_outputs               r;   Úeager_attention_forwardr÷   J  sì   € ô —<’< §}¡}°Q¸Ó':Ó;¸gÑE€LØÑ!Ø$¢Qªª1¨o°·	±	¸"±¨oÐ%=Ñ>ˆØ#Ñ1ˆä—=‘=×(Ñ(¨¸2ÄUÇ]Á]Ð(ÐS×VÑVÐW\×WbÑWbÓc€LÜ—=‘=×(Ñ(¨È6Ï?É?Ð(Ð[€LàÑØ#§n¡n°Q¸¸A¸qÓ&AÑAˆä—,’,˜|Ó3€KØ×'Ñ'¨¨1Ó-×8Ñ8Ó:€KØÐ$Ð$rL   c                   ó¸   ^ • \ rS rSrU 4S jr   S
S\R                  S\\R                     S\\R                     S\\	   S\
\R                     4
S jjrS	rU =r$ )ÚMarkupLMSelfAttentionif  c                 ó6  >• [         TU ]  5         UR                  UR                  -  S:w  a7  [	        US5      (       d&  [        SUR                   SUR                   S35      eXl        UR                  U l        [        UR                  UR                  -  5      U l        U R                  U R                  -  U l	        [        R                  " UR                  U R                  5      U l        [        R                  " UR                  U R                  5      U l        [        R                  " UR                  U R                  5      U l        [        R                  " UR                   5      U l        UR                   U l        U R                  S-  U l        g )Nr   Úembedding_sizezThe hidden size (z6) is not a multiple of the number of attention heads (Ú)g      à¿)r"   r#   r'   Únum_attention_headsÚhasattrÚ
ValueErrorr8   rW   Úattention_head_sizeÚall_head_sizer   r%   rß   rà   rá   r)   Úattention_probs_dropout_probr+   Úattention_dropoutrã   ru   s     €r;   r#   ÚMarkupLMSelfAttention.__init__g  sD  ø€ Ü‰ÑÔØ×Ñ × :Ñ :Ñ:¸aÓ?ÌÐPVÐXh×HiÑHiÜØ# F×$6Ñ$6Ð#7ð 8Ø ×4Ñ4Ð5°Qð8óð ð
 ŒØ#)×#=Ñ#=ˆÔ Ü#& v×'9Ñ'9¸F×<VÑ<VÑ'VÓ#WˆÔ Ø!×5Ñ5¸×8PÑ8PÑPˆÔä—Y’Y˜v×1Ñ1°4×3EÑ3EÓFˆŒ
Ü—9’9˜V×/Ñ/°×1CÑ1CÓDˆŒÜ—Y’Y˜v×1Ñ1°4×3EÑ3EÓFˆŒ
ä—z’z &×"EÑ"EÓFˆŒØ!'×!DÑ!DˆÔØ×/Ñ/°Ñ5ˆrL   r”   râ   rä   Úoutput_attentionsr–   c                 óº  • UR                   S S n/ UQSPU R                  P7nU R                  U5      R                  U5      R	                  SS5      nU R                  U5      R                  U5      R	                  SS5      n	U R                  U5      R                  U5      R	                  SS5      n
[        nU R                  R                  S:w  a  [        U R                  R                     nU" U UU	U
U4U R                  (       d  SOU R                  U R                  US.UD6u  pÍUR                  " / UQSP76 R                  5       nU(       a  XÍ4nU$ U4nU$ )Nr>   r   ræ   Úeagerç        )r+   rã   rä   )rì   r   rß   rñ   rë   rà   rá   r÷   r8   Ú_attn_implementationr   ré   r  rã   Úreshaperò   )r7   r”   râ   rä   r  ró   r~   Úhidden_shapeÚquery_statesÚ
key_statesÚvalue_statesÚattention_interfacerö   rô   Úoutputss                  r;   rJ   ÚMarkupLMSelfAttention.forward|  s[  € ð $×)Ñ)¨#¨2Ð.ˆØC˜ÐC bÐC¨$×*BÑ*BÑCˆà—z‘z -Ó0×5Ñ5°lÓC×MÑMÈaÐQRÓSˆØ—X‘X˜mÓ,×1Ñ1°,Ó?×IÑIÈ!ÈQÓOˆ
Ø—z‘z -Ó0×5Ñ5°lÓC×MÑMÈaÐQRÓSˆä(?ÐØ;‰;×+Ñ+¨wÓ6Ü"9¸$¿+¹+×:ZÑ:ZÑ"[Ðá$7ØØØØØð
%
ð  $Ÿ}Ÿ}‘C°$×2HÑ2HØ—L‘LØñ
%
ð ñ
%
Ñ!ˆð "×)Ò)Ð;¨;Ð;¸Ò;×FÑFÓHˆÞ1B;Ð-ˆØˆð JUÈˆØˆrL   )
r  r  r   r8   r+   rà   rý   rß   rã   rá   ©NNF)rM   rN   rO   rP   r#   rB   rŸ   r   ÚFloatTensorÚboolr†   rJ   rR   rS   rT   s   @r;   rù   rù   f  st   ø† õ6ð0 7;Ø15Ø,1ñ!à—|‘|ð!ð ! ×!2Ñ!2Ñ3ð!ð ˜E×-Ñ-Ñ.ð	!ð
 $ D™>ð!ð 
ˆu|‰|Ñ	÷!ó !rL   rù   c                   ó¾   ^ • \ rS rSrU 4S jrS r   SS\R                  S\\R                     S\\R                     S\\
   S\\R                     4
S	 jjrS
rU =r$ )ÚMarkupLMAttentioni¡  c                 ó€   >• [         TU ]  5         [        U5      U l        [	        U5      U l        [        5       U l        g r˜   )r"   r#   rù   r7   rŽ   ÚoutputÚsetÚpruned_headsru   s     €r;   r#   ÚMarkupLMAttention.__init__¢  s0   ø€ Ü‰ÑÔÜ)¨&Ó1ˆŒ	Ü(¨Ó0ˆŒÜ›EˆÕrL   c                 ó6  • [        U5      S:X  a  g [        XR                  R                  U R                  R                  U R
                  5      u  p[        U R                  R                  U5      U R                  l        [        U R                  R                  U5      U R                  l        [        U R                  R                  U5      U R                  l	        [        U R                  R                  USS9U R                  l        U R                  R                  [        U5      -
  U R                  l        U R                  R                  U R                  R                  -  U R                  l        U R
                  R                  U5      U l        g )Nr   r   r?   )Úlenr   r7   rý   r   r  r   rß   rà   rá   r  r’   r  Úunion)r7   ÚheadsÚindexs      r;   Úprune_headsÚMarkupLMAttention.prune_heads¨  s  € Üˆu‹:˜‹?ØÜ7Ø—9‘9×0Ñ0°$·)±)×2OÑ2OÐQU×QbÑQbó
‰ˆô
 -¨T¯Y©Y¯_©_¸eÓDˆ	‰	ŒÜ*¨4¯9©9¯=©=¸%Ó@ˆ	‰	ŒÜ,¨T¯Y©Y¯_©_¸eÓDˆ	‰	ŒÜ.¨t¯{©{×/@Ñ/@À%ÈQÑOˆ‰Ôð )-¯	©	×(EÑ(EÌÈEË
Ñ(Rˆ	‰	Ô%Ø"&§)¡)×"?Ñ"?À$Ç)Á)×B_ÑB_Ñ"_ˆ	‰	ÔØ ×-Ñ-×3Ñ3°EÓ:ˆÕrL   r”   râ   rä   r  r–   c                 óp   • U R                   " U4UUUS.UD6nU R                  US   U5      nU4USS  -   nU$ ©N)râ   rä   r  r   r   )r7   r  )	r7   r”   râ   rä   r  ró   Úself_outputsÚattention_outputr  s	            r;   rJ   ÚMarkupLMAttention.forwardº  s]   € ð —y’yØð
à)ØØ/ñ	
ð
 ñ
ˆð  Ÿ;™; |°A¡¸ÓFÐØ#Ð%¨°Q°RÐ(8Ñ8ˆØˆrL   )r  r  r7   r  )rM   rN   rO   rP   r#   r!  rB   rŸ   r   r  r  r†   rJ   rR   rS   rT   s   @r;   r  r  ¡  sy   ø† õ"ò;ð* 7;Ø15Ø,1ñà—|‘|ðð ! ×!2Ñ!2Ñ3ðð ˜E×-Ñ-Ñ.ð	ð
 $ D™>ðð 
ˆu|‰|Ñ	÷ó rL   r  c                   ó¾   ^ • \ rS rSrU 4S jr   SS\R                  S\\R                     S\\R                     S\\	   S\
\R                     4
S jjrS	 rS
rU =r$ )ÚMarkupLMLayeriÏ  c                 ó²   >• [         TU ]  5         UR                  U l        SU l        [	        U5      U l        [        U5      U l        [        U5      U l	        g )Nr   )
r"   r#   Úchunk_size_feed_forwardÚseq_len_dimr  Ú	attentionr¢   Úintermediater°   r  ru   s     €r;   r#   ÚMarkupLMLayer.__init__Ð  sI   ø€ Ü‰ÑÔØ'-×'EÑ'EˆÔ$ØˆÔÜ*¨6Ó2ˆŒÜ0°Ó8ˆÔÜ$ VÓ,ˆrL   r”   râ   rä   r  r–   c                 ó¬   • U R                   " U4UUUS.UD6nUS   nUSS  n[        U R                  U R                  U R                  U5      n	U	4U-   nU$ r$  )r-  r   Úfeed_forward_chunkr+  r,  )
r7   r”   râ   rä   r  ró   Úself_attention_outputsr&  r  Úlayer_outputs
             r;   rJ   ÚMarkupLMLayer.forwardØ  s€   € ð "&§¢Øð"
à)ØØ/ñ	"
ð
 ñ"
Ðð 2°!Ñ4Ðà(¨¨Ð,ˆÜ0Ø×#Ñ# T×%AÑ%AÀ4×CSÑCSÐUeó
ˆð  / GÑ+ˆàˆrL   c                 óJ   • U R                  U5      nU R                  X!5      nU$ r˜   )r.  r  )r7   r&  Úintermediate_outputr3  s       r;   r1  Ú MarkupLMLayer.feed_forward_chunkñ  s)   € Ø"×/Ñ/Ð0@ÓAÐØ—{‘{Ð#6ÓIˆØÐrL   )r-  r+  r.  r  r,  r  )rM   rN   rO   rP   r#   rB   rŸ   r   r  r  r†   rJ   r1  rR   rS   rT   s   @r;   r)  r)  Ï  sy   ø† õ-ð 7;Ø15Ø,1ñà—|‘|ðð ! ×!2Ñ!2Ñ3ðð ˜E×-Ñ-Ñ.ð	ð
 $ D™>ðð 
ˆu|‰|Ñ	õ÷2ð rL   r)  c                   óä   ^ • \ rS rSrU 4S jr\     SS\R                  S\\R                     S\\R                     S\\
   S\\
   S\\
   S	\\\R                     \4   4S
 jj5       rSrU =r$ )ÚMarkupLMEncoderiø  c                 óÔ   >• [         TU ]  5         Xl        [        R                  " [        UR                  5       Vs/ sH  n[        U5      PM     sn5      U l        SU l	        g s  snf )NF)
r"   r#   r8   r   r0   r1   Únum_hidden_layersr)  ÚlayerÚgradient_checkpointing)r7   r8   rH   r:   s      €r;   r#   ÚMarkupLMEncoder.__init__ù  sR   ø€ Ü‰ÑÔØŒÜ—]’]Ä5È×IaÑIaÔCbÓ#cÑCb¸a¤M°&Ö$9ÑCbÑ#cÓdˆŒ
Ø&+ˆÕ#ùò $ds   ½A%r”   râ   rä   r  Úoutput_hidden_statesÚreturn_dictr–   c           	      ó  • U(       a  SOS nU(       a  SOS n	[        U R                  5       H=  u  p«U(       a  X4-   nUb  X:   OS nU" SUUUUS.UD6nUS   nU(       d  M5  XS   4-   n	M?     U(       a  X4-   n[        UUU	S9$ )N© )r”   râ   rä   r  r   r   )Úlast_hidden_stater”   Ú
attentions)Ú	enumerater<  r   )r7   r”   râ   rä   r  r?  r@  ró   Úall_hidden_statesÚall_self_attentionsrH   Úlayer_moduleÚlayer_head_maskÚlayer_outputss                 r;   rJ   ÚMarkupLMEncoder.forwardÿ  s¹   € ö #7™B¸DÐÞ$5™b¸4Ðä(¨¯©Ö4‰OˆAÞ#Ø$5Ð8HÑ$HÐ!à.7Ñ.C˜išlÈˆOá(ð Ø+Ø-Ø)Ø"3ñ	ð
 ñˆMð *¨!Ñ,ˆMß Ð Ø&9È1Ñ=MÐ<OÑ&OÒ#ñ!  5ö$  Ø 1Ð4DÑ DÐäØ+Ø+Ø*ñ
ð 	
rL   )r8   r=  r<  )NNFFT)rM   rN   rO   rP   r#   r   rB   rŸ   r   r  r  r   r†   r   rJ   rR   rS   rT   s   @r;   r9  r9  ø  sª   ø† õ,ð ð 7;Ø15Ø,1Ø/4Ø&*ñ&
à—|‘|ð&
ð ! ×!2Ñ!2Ñ3ð&
ð ˜E×-Ñ-Ñ.ð	&
ð
 $ D™>ð&
ð ' t™nð&
ð ˜d‘^ð&
ð 
ˆuU—\‘\Ñ" OÐ3Ñ	4ô&
ó ö&
rL   r9  c                   ót   ^ • \ rS rSr% \\S'   SrS r\S\	\
\\R                  4      4U 4S jj5       rSrU =r$ )ÚMarkupLMPreTrainedModeli)  r8   Úmarkuplmc                 óŒ  • [        U[        R                  5      (       ak  UR                  R                  R                  SU R                  R                  S9  UR                  b%  UR                  R                  R                  5         gg[        U[        R                  5      (       ax  UR                  R                  R                  SU R                  R                  S9  UR                  b2  UR                  R                  UR                     R                  5         gg[        U[        R                  5      (       aJ  UR                  R                  R                  5         UR                  R                  R                  S5        g[        U[        5      (       a%  UR                  R                  R                  5         gg)zInitialize the weightsr  )ÚmeanÚstdNç      ð?)r¦   r   r%   ÚweightÚdataÚnormal_r8   Úinitializer_rangerÉ   Úzero_r2   r\   rp   Úfill_rÇ   )r7   rÞ   s     r;   Ú_init_weightsÚ%MarkupLMPreTrainedModel._init_weights/  s3  € äfœbŸi™i×(Ñ(ð M‰M×Ñ×&Ñ&¨C°T·[±[×5RÑ5RÐ&ÑSØ{‰{Ñ&Ø—‘× Ñ ×&Ñ&Õ(ð 'ä˜¤§¡×-Ñ-ØM‰M×Ñ×&Ñ&¨C°T·[±[×5RÑ5RÐ&ÑSØ×!Ñ!Ñ-Ø—‘×"Ñ" 6×#5Ñ#5Ñ6×<Ñ<Õ>ð .ä˜¤§¡×-Ñ-ØK‰K×Ñ×"Ñ"Ô$ØM‰M×Ñ×$Ñ$ SÕ)Ü˜Ô 8×9Ñ9ØK‰K×Ñ×"Ñ"Õ$ð :rL   Úpretrained_model_name_or_pathc                 ó,   >• [         TU ]  " U/UQ70 UD6$ r˜   )r"   Úfrom_pretrained)Úclsr[  Ú
model_argsró   r:   s       €r;   r]  Ú'MarkupLMPreTrainedModel.from_pretrainedA  s   ø€ ä‰wÒ&Ð'DÐ\ÀzÒ\ÐU[Ñ\Ð\rL   rB  )rM   rN   rO   rP   r   Ú__annotations__Úbase_model_prefixrY  Úclassmethodr   r   r¨   ÚosÚPathLiker]  rR   rS   rT   s   @r;   rM  rM  )  sH   ø‡ àÓØ"Ðò%ð$ ð]¸HÀUÈ3ÐPR×P[ÑP[ÐK[ÑE\Ñ<]ö ]ó ö]rL   rM  c                   ó’  ^ • \ rS rSrSU 4S jjrS rS rS r\\	           SS\
\R                     S\
\R                     S\
\R                     S	\
\R                     S
\
\R                     S\
\R                     S\
\R                     S\
\R                     S\
\   S\
\   S\
\   S\\\4   4S jj5       5       rSrU =r$ )ÚMarkupLMModeliF  c                 óÂ   >• [         TU ]  U5        Xl        [        U5      U l        [        U5      U l        U(       a  [        U5      OSU l        U R                  5         g)z^
add_pooling_layer (bool, *optional*, defaults to `True`):
    Whether to add a pooling layer
N)
r"   r#   r8   rb   r‹   r9  Úencoderr·   ÚpoolerÚ	post_init)r7   r8   Úadd_pooling_layerr:   s      €r;   r#   ÚMarkupLMModel.__init__I  sK   ø€ ô
 	‰Ñ˜Ô ØŒä,¨VÓ4ˆŒÜ& vÓ.ˆŒæ0A”n VÔ,ÀtˆŒð 	‰ÕrL   c                 ó.   • U R                   R                  $ r˜   ©r‹   rk   rÏ   s    r;   Úget_input_embeddingsÚ"MarkupLMModel.get_input_embeddingsY  s   € Ø‰×.Ñ.Ð.rL   c                 ó$   • XR                   l        g r˜   ro  )r7   rá   s     r;   Úset_input_embeddingsÚ"MarkupLMModel.set_input_embeddings\  s   € Ø*/‰Õ'rL   c                 óš   • UR                  5        H7  u  p#U R                  R                  U   R                  R	                  U5        M9     g)z…
Prunes heads of the model. heads_to_prune: dict of {layer_num: list of heads to prune in this layer} See base
class PreTrainedModel
N)Úitemsri  r<  r-  r!  )r7   Úheads_to_pruner<  r  s       r;   Ú_prune_headsÚMarkupLMModel._prune_heads_  s<   € ð
 +×0Ñ0Ö2‰LˆEØL‰L×Ñ˜uÑ%×/Ñ/×;Ñ;¸EÖBò 3rL   r[   rD   rE   râ   r‰   rg   rä   r}   r  r?  r@  r–   c           	      ó|  • U	b  U	OU R                   R                  n	U
b  U
OU R                   R                  n
Ub  UOU R                   R                  nUb  Ub  [	        S5      eUb"  U R                  X5        UR                  5       nO"Ub  UR                  5       SS nO[	        S5      eUb  UR                  OUR                  nUc  [        R                  " XÍS9nUc$  [        R                  " U[        R                  US9nUR                  S5      R                  S5      nUR                  U R                  S	9nS
U-
  S-  nUbð  UR                  5       S:X  ah  UR                  S5      R                  S5      R                  S5      R                  S5      nUR!                  U R                   R"                  SSSS5      nOCUR                  5       S:X  a/  UR                  S5      R                  S5      R                  S5      nUR                  [%        U R'                  5       5      R                  S	9nOS/U R                   R"                  -  nU R)                  UUUUUUS9nU R+                  UUUU	U
SS9nUS   nU R,                  b  U R-                  U5      OSn[/        UUUR0                  UR2                  S9$ )ao  
xpath_tags_seq (`torch.LongTensor` of shape `(batch_size, sequence_length, config.max_depth)`, *optional*):
    Tag IDs for each token in the input sequence, padded up to config.max_depth.
xpath_subs_seq (`torch.LongTensor` of shape `(batch_size, sequence_length, config.max_depth)`, *optional*):
    Subscript IDs for each token in the input sequence, padded up to config.max_depth.

Examples:

```python
>>> from transformers import AutoProcessor, MarkupLMModel

>>> processor = AutoProcessor.from_pretrained("microsoft/markuplm-base")
>>> model = MarkupLMModel.from_pretrained("microsoft/markuplm-base")

>>> html_string = "<html> <head> <title>Page Title</title> </head> </html>"

>>> encoding = processor(html_string, return_tensors="pt")

>>> outputs = model(**encoding)
>>> last_hidden_states = outputs.last_hidden_state
>>> list(last_hidden_states.shape)
[1, 4, 768]
```NzDYou cannot specify both input_ids and inputs_embeds at the same timer>   z5You have to specify either input_ids or inputs_embeds)rz   rx   r   ræ   )ry   rR  g     ˆÃÀr   )r[   rD   rE   rg   r‰   r}   T)rä   r  r?  r@  )rC  Úpooler_outputr”   rD  )r8   r  r?  Úuse_return_dictrÿ   Ú%warn_if_padding_and_no_attention_maskr{   rz   rB   r…   rƒ   rZ   r|   rð   ry   r@   rt   r;  ÚnextÚ
parametersr‹   ri  rj  r   r”   rD  )r7   r[   rD   rE   râ   r‰   rg   rä   r}   r  r?  r@  r~   rz   Úextended_attention_maskÚembedding_outputÚencoder_outputsrÙ   r½   s                      r;   rJ   ÚMarkupLMModel.forwardg  s­  € ðN 2CÑ1NÑ-ÐTX×T_ÑT_×TqÑTqÐà$8Ñ$DÑ È$Ï+É+×JjÑJjð 	ð &1Ñ%<‘kÀ$Ç+Á+×B]ÑB]ˆàÑ  ]Ñ%>ÜÐcÓdÐdØÑ"Ø×6Ñ6°yÔQØ#Ÿ.™.Ó*‰KØÑ&Ø'×,Ñ,Ó.¨s°Ð3‰KäÐTÓUÐUà%.Ñ%:×!Ò!À×@TÑ@TˆàÑ!Ü"ŸZšZ¨ÑCˆNàÑ!Ü"Ÿ[š[¨¼E¿J¹JÈvÑVˆNà"0×":Ñ":¸1Ó"=×"GÑ"GÈÓ"JÐØ"9×"<Ñ"<À4Ç:Á:Ð"<Ð"NÐØ#&Ð)@Ñ#@ÀHÑ"LÐàÑ Ø}‰}‹ !Ó#Ø%×/Ñ/°Ó2×<Ñ<¸QÓ?×IÑIÈ"ÓM×WÑWÐXZÓ[	Ø%×,Ñ,¨T¯[©[×-JÑ-JÈBÐPRÐTVÐXZÓ[‘	Ø—‘“ AÓ%Ø%×/Ñ/°Ó2×<Ñ<¸RÓ@×JÑJÈ2ÓN	Ø!Ÿ™¬4°·±Ó0AÓ+B×+HÑ+H˜ÐI‰Ià˜ §¡×!>Ñ!>Ñ>ˆIàŸ?™?ØØ)Ø)Ø%Ø)Ø'ð +ð 
Ðð Ÿ,™,ØØ#ØØ/Ø!5Øð 'ð 
ˆð *¨!Ñ,ˆØ8<¿¹Ñ8O˜Ÿ™ OÔ4ÐUYˆä)Ø-Ø'Ø)×7Ñ7Ø&×1Ñ1ñ	
ð 	
rL   )r8   r‹   ri  rj  )T)NNNNNNNNNNN)rM   rN   rO   rP   r#   rp  rs  rx  r   r   r   rB   Ú
LongTensorr  r  r   r†   r   rJ   rR   rS   rT   s   @r;   rg  rg  F  sJ  ø† ÷ò /ò0òCð Øð 15Ø59Ø59Ø6:Ø59Ø37Ø15Ø59Ø,0Ø/3Ø&*ñc
à˜E×,Ñ,Ñ-ðc
ð ! ×!1Ñ!1Ñ2ðc
ð ! ×!1Ñ!1Ñ2ð	c
ð
 ! ×!2Ñ!2Ñ3ðc
ð ! ×!1Ñ!1Ñ2ðc
ð ˜u×/Ñ/Ñ0ðc
ð ˜E×-Ñ-Ñ.ðc
ð   × 1Ñ 1Ñ2ðc
ð $ D™>ðc
ð ' t™nðc
ð ˜d‘^ðc
ð 
ˆuÐ0Ð0Ñ	1ôc
ó ó öc
rL   rg  c            !       óÖ  ^ • \ rS rSrU 4S jr\\             SS\\R                     S\\R                     S\\R                     S\\R                     S\\R                     S\\R                     S	\\R                     S
\\R                     S\\R                     S\\R                     S\\
   S\\
   S\\
   S\\\R                     \4   4S jj5       5       rSrU =r$ )ÚMarkupLMForQuestionAnsweringiÏ  c                 óä   >• [         TU ]  U5        UR                  U l        [        USS9U l        [
        R                  " UR                  UR                  5      U l        U R                  5         g ©NF)rl  )
r"   r#   Ú
num_labelsrg  rN  r   r%   r'   Ú
qa_outputsrk  ru   s     €r;   r#   Ú%MarkupLMForQuestionAnswering.__init__Ò  sU   ø€ Ü‰Ñ˜Ô Ø ×+Ñ+ˆŒä% fÀÑFˆŒÜŸ)š) F×$6Ñ$6¸×8IÑ8IÓJˆŒð 	‰ÕrL   r[   rD   rE   râ   r‰   rg   rä   r}   Ústart_positionsÚend_positionsr  r?  r@  r–   c                 óò  • Ub  UOU R                   R                  nU R                  UUUUUUUUUUSS9nUS   nU R                  U5      nUR	                  SSS9u  nnUR                  S5      R                  5       nUR                  S5      R                  5       nSnU	b·  U
b´  [        U	R                  5       5      S:”  a  U	R                  S5      n	[        U
R                  5       5      S:”  a  U
R                  S5      n
UR                  S5      nU	R                  SU5        U
R                  SU5        [        US9nU" UU	5      nU" UU
5      nUU-   S	-  n[        UUUUR                  UR                  S
9$ )a½  
xpath_tags_seq (`torch.LongTensor` of shape `(batch_size, sequence_length, config.max_depth)`, *optional*):
    Tag IDs for each token in the input sequence, padded up to config.max_depth.
xpath_subs_seq (`torch.LongTensor` of shape `(batch_size, sequence_length, config.max_depth)`, *optional*):
    Subscript IDs for each token in the input sequence, padded up to config.max_depth.

Examples:

```python
>>> from transformers import AutoProcessor, MarkupLMForQuestionAnswering
>>> import torch

>>> processor = AutoProcessor.from_pretrained("microsoft/markuplm-base-finetuned-websrc")
>>> model = MarkupLMForQuestionAnswering.from_pretrained("microsoft/markuplm-base-finetuned-websrc")

>>> html_string = "<html> <head> <title>My name is Niels</title> </head> </html>"
>>> question = "What's his name?"

>>> encoding = processor(html_string, questions=question, return_tensors="pt")

>>> with torch.no_grad():
...     outputs = model(**encoding)

>>> answer_start_index = outputs.start_logits.argmax()
>>> answer_end_index = outputs.end_logits.argmax()

>>> predict_answer_tokens = encoding.input_ids[0, answer_start_index : answer_end_index + 1]
>>> processor.decode(predict_answer_tokens).strip()
'Niels'
```NT©
rD   rE   râ   r‰   rg   rä   r}   r  r?  r@  r   r   r>   r?   )Úignore_indexræ   )ÚlossÚstart_logitsÚ
end_logitsr”   rD  )r8   r|  rN  rŠ  ÚsplitÚsqueezerò   r  r{   Úclamp_r   r   r”   rD  )r7   r[   rD   rE   râ   r‰   rg   rä   r}   rŒ  r  r  r?  r@  r  rÙ   Úlogitsr’  r“  Ú
total_lossÚignored_indexÚloss_fctÚ
start_lossÚend_losss                           r;   rJ   Ú$MarkupLMForQuestionAnswering.forwardÜ  s–  € ð` &1Ñ%<‘kÀ$Ç+Á+×B]ÑB]ˆà—-‘-ØØ)Ø)Ø)Ø)Ø%ØØ'Ø/Ø!5Øð  ð 
ˆð " !™*ˆà—‘ Ó1ˆØ#)§<¡<°°r <Ð#:Ñ ˆjØ#×+Ñ+¨BÓ/×:Ñ:Ó<ˆØ×'Ñ'¨Ó+×6Ñ6Ó8ˆ
àˆ
ØÑ&¨=Ñ+Dä?×'Ñ'Ó)Ó*¨QÓ.Ø"1×"9Ñ"9¸"Ó"=Ü=×%Ñ%Ó'Ó(¨1Ó,Ø -× 5Ñ 5°bÓ 9à(×-Ñ-¨aÓ0ˆMØ×"Ñ" 1 mÔ4Ø× Ñ   MÔ2ä'°]ÑCˆHÙ! ,°Ó@ˆJÙ 
¨MÓ:ˆHØ$ xÑ/°1Ñ4ˆJä+ØØ%Ø!Ø!×/Ñ/Ø×)Ñ)ñ
ð 	
rL   )rN  r‰  rŠ  )NNNNNNNNNNNNN)rM   rN   rO   rP   r#   r   r   r   rB   rŸ   r  r   r†   r   rJ   rR   rS   rT   s   @r;   r†  r†  Ï  sa  ø† õð Øð -1Ø15Ø15Ø15Ø15Ø/3Ø,0Ø04Ø26Ø04Ø,0Ø/3Ø&*ñ\
à˜EŸL™LÑ)ð\
ð ! §¡Ñ.ð\
ð ! §¡Ñ.ð	\
ð
 ! §¡Ñ.ð\
ð ! §¡Ñ.ð\
ð ˜uŸ|™|Ñ,ð\
ð ˜EŸL™LÑ)ð\
ð   §¡Ñ-ð\
ð " %§,¡,Ñ/ð\
ð   §¡Ñ-ð\
ð $ D™>ð\
ð ' t™nð\
ð ˜d‘^ð\
ð 
ˆuU—\‘\Ñ"Ð$@Ð@Ñ	Aô\
ó ó ö\
rL   r†  zC
    MarkupLM Model with a `token_classification` head on top.
    )Úcustom_introc                   ó¶  ^ • \ rS rSrU 4S jr\\            SS\\R                     S\\R                     S\\R                     S\\R                     S\\R                     S\\R                     S	\\R                     S
\\R                     S\\R                     S\\
   S\\
   S\\
   S\\\R                     \4   4S jj5       5       rSrU =r$ )ÚMarkupLMForTokenClassificationi=  c                 ód  >• [         TU ]  U5        UR                  U l        [        USS9U l        UR
                  b  UR
                  OUR                  n[        R                  " U5      U l	        [        R                  " UR                  UR                  5      U l        U R                  5         g rˆ  )r"   r#   r‰  rg  rN  Úclassifier_dropoutr*   r   r)   r+   r%   r'   Ú
classifierrk  ©r7   r8   r¢  r:   s      €r;   r#   Ú'MarkupLMForTokenClassification.__init__D  sŠ   ø€ Ü‰Ñ˜Ô Ø ×+Ñ+ˆŒä% fÀÑFˆŒà)/×)BÑ)BÑ)NˆF×%Ò%ÐTZ×TnÑTnð 	ô —z’zÐ"4Ó5ˆŒÜŸ)š) F×$6Ñ$6¸×8IÑ8IÓJˆŒð 	‰ÕrL   r[   rD   rE   râ   r‰   rg   rä   r}   Úlabelsr  r?  r@  r–   c                 ól  • Ub  UOU R                   R                  nU R                  UUUUUUUUU
USS9nUS   nU R                  U5      nSnU	bF  [	        5       nU" UR                  SU R                   R                  5      U	R                  S5      5      n[        UUUR                  UR                  S9$ )aé  
xpath_tags_seq (`torch.LongTensor` of shape `(batch_size, sequence_length, config.max_depth)`, *optional*):
    Tag IDs for each token in the input sequence, padded up to config.max_depth.
xpath_subs_seq (`torch.LongTensor` of shape `(batch_size, sequence_length, config.max_depth)`, *optional*):
    Subscript IDs for each token in the input sequence, padded up to config.max_depth.
labels (`torch.LongTensor` of shape `(batch_size, sequence_length)`, *optional*):
    Labels for computing the token classification loss. Indices should be in `[0, ..., config.num_labels - 1]`.

Examples:

```python
>>> from transformers import AutoProcessor, AutoModelForTokenClassification
>>> import torch

>>> processor = AutoProcessor.from_pretrained("microsoft/markuplm-base")
>>> processor.parse_html = False
>>> model = AutoModelForTokenClassification.from_pretrained("microsoft/markuplm-base", num_labels=7)

>>> nodes = ["hello", "world"]
>>> xpaths = ["/html/body/div/li[1]/div/span", "/html/body/div/li[1]/div/span"]
>>> node_labels = [1, 2]
>>> encoding = processor(nodes=nodes, xpaths=xpaths, node_labels=node_labels, return_tensors="pt")

>>> with torch.no_grad():
...     outputs = model(**encoding)

>>> loss = outputs.loss
>>> logits = outputs.logits
```NTr  r   r>   ©r‘  r—  r”   rD  )
r8   r|  rN  r£  r   rñ   r‰  r   r”   rD  )r7   r[   rD   rE   râ   r‰   rg   rä   r}   r¦  r  r?  r@  r  rÙ   rÜ   r‘  rš  s                     r;   rJ   Ú&MarkupLMForTokenClassification.forwardR  sÒ   € ð\ &1Ñ%<‘kÀ$Ç+Á+×B]ÑB]ˆà—-‘-ØØ)Ø)Ø)Ø)Ø%ØØ'Ø/Ø!5Øð  ð 
ˆð " !™*ˆØ ŸO™O¨OÓ<ÐàˆØÑÜ'Ó)ˆHÙØ!×&Ñ& r¨4¯;©;×+AÑ+AÓBØ—‘˜B“óˆDô
 %ØØ$Ø!×/Ñ/Ø×)Ñ)ñ	
ð 	
rL   )r£  r+   rN  r‰  ©NNNNNNNNNNNN)rM   rN   rO   rP   r#   r   r   r   rB   rŸ   r  r   r†   r   rJ   rR   rS   rT   s   @r;   r   r   =  sI  ø† õð Øð -1Ø15Ø15Ø15Ø15Ø/3Ø,0Ø04Ø)-Ø,0Ø/3Ø&*ñL
à˜EŸL™LÑ)ðL
ð ! §¡Ñ.ðL
ð ! §¡Ñ.ð	L
ð
 ! §¡Ñ.ðL
ð ! §¡Ñ.ðL
ð ˜uŸ|™|Ñ,ðL
ð ˜EŸL™LÑ)ðL
ð   §¡Ñ-ðL
ð ˜Ÿ™Ñ&ðL
ð $ D™>ðL
ð ' t™nðL
ð ˜d‘^ðL
ð 
ˆuU—\‘\Ñ" NÐ2Ñ	3ôL
ó ó öL
rL   r   z 
    MarkupLM Model transformer with a sequence classification/regression head on top (a linear layer on top of the
    pooled output) e.g. for GLUE tasks.
    c                   ó¶  ^ • \ rS rSrU 4S jr\\            SS\\R                     S\\R                     S\\R                     S\\R                     S\\R                     S\\R                     S	\\R                     S
\\R                     S\\R                     S\\
   S\\
   S\\
   S\\\R                     \4   4S jj5       5       rSrU =r$ )Ú!MarkupLMForSequenceClassificationi£  c                 ór  >• [         TU ]  U5        UR                  U l        Xl        [	        U5      U l        UR                  b  UR                  OUR                  n[        R                  " U5      U l
        [        R                  " UR                  UR                  5      U l        U R                  5         g r˜   )r"   r#   r‰  r8   rg  rN  r¢  r*   r   r)   r+   r%   r'   r£  rk  r¤  s      €r;   r#   Ú*MarkupLMForSequenceClassification.__init__«  s   ø€ Ü‰Ñ˜Ô Ø ×+Ñ+ˆŒØŒä% fÓ-ˆŒà)/×)BÑ)BÑ)NˆF×%Ò%ÐTZ×TnÑTnð 	ô —z’zÐ"4Ó5ˆŒÜŸ)š) F×$6Ñ$6¸×8IÑ8IÓJˆŒð 	‰ÕrL   r[   rD   rE   râ   r‰   rg   rä   r}   r¦  r  r?  r@  r–   c                 ó   • Ub  UOU R                   R                  nU R                  UUUUUUUUU
USS9nUS   nU R                  U5      nU R	                  U5      nSnU	GbŽ  U R                   R
                  c‘  U R                  S:X  a  SU R                   l        OoU R                  S:”  aN  U	R                  [        R                  :X  d  U	R                  [        R                  :X  a  SU R                   l        OSU R                   l        U R                   R
                  S:X  aI  [        5       nU R                  S:X  a&  U" UR                  5       U	R                  5       5      nOŒU" Xù5      nOƒU R                   R
                  S:X  a=  [        5       nU" UR                  SU R                  5      U	R                  S5      5      nO,U R                   R
                  S:X  a  [        5       nU" Xù5      n[!        UUUR"                  UR$                  S	9$ )
a  
xpath_tags_seq (`torch.LongTensor` of shape `(batch_size, sequence_length, config.max_depth)`, *optional*):
    Tag IDs for each token in the input sequence, padded up to config.max_depth.
xpath_subs_seq (`torch.LongTensor` of shape `(batch_size, sequence_length, config.max_depth)`, *optional*):
    Subscript IDs for each token in the input sequence, padded up to config.max_depth.
labels (`torch.LongTensor` of shape `(batch_size,)`, *optional*):
    Labels for computing the sequence classification/regression loss. Indices should be in `[0, ...,
    config.num_labels - 1]`. If `config.num_labels == 1` a regression loss is computed (Mean-Square loss), If
    `config.num_labels > 1` a classification loss is computed (Cross-Entropy).

Examples:

```python
>>> from transformers import AutoProcessor, AutoModelForSequenceClassification
>>> import torch

>>> processor = AutoProcessor.from_pretrained("microsoft/markuplm-base")
>>> model = AutoModelForSequenceClassification.from_pretrained("microsoft/markuplm-base", num_labels=7)

>>> html_string = "<html> <head> <title>Page Title</title> </head> </html>"
>>> encoding = processor(html_string, return_tensors="pt")

>>> with torch.no_grad():
...     outputs = model(**encoding)

>>> loss = outputs.loss
>>> logits = outputs.logits
```NTr  r   Ú
regressionÚsingle_label_classificationÚmulti_label_classificationr>   r¨  )r8   r|  rN  r+   r£  Úproblem_typer‰  ry   rB   rZ   rW   r	   r•  r   rñ   r   r   r”   rD  )r7   r[   rD   rE   râ   r‰   rg   rä   r}   r¦  r  r?  r@  r  r½   r—  r‘  rš  s                     r;   rJ   Ú)MarkupLMForSequenceClassification.forwardº  s¿  € ðZ &1Ñ%<‘kÀ$Ç+Á+×B]ÑB]ˆà—-‘-ØØ)Ø)Ø)Ø)Ø%ØØ'Ø/Ø!5Øð  ð 
ˆð   ™
ˆàŸ™ ]Ó3ˆØ—‘ Ó/ˆàˆØÒØ{‰{×'Ñ'Ñ/Ø—?‘? aÓ'Ø/;D—K‘KÕ,Ø—_‘_ qÓ(¨f¯l©l¼e¿j¹jÓ.HÈFÏLÉLÔ\a×\eÑ\eÓLeØ/LD—K‘KÕ,à/KD—K‘KÔ,à{‰{×'Ñ'¨<Ó7Ü"›9Ø—?‘? aÓ'Ù# F§N¡NÓ$4°f·n±nÓ6FÓG‘Dá# FÓ3‘DØ—‘×)Ñ)Ð-JÓJÜ+Ó-Ù §¡¨B°·±Ó @À&Ç+Á+ÈbÃ/ÓR‘Ø—‘×)Ñ)Ð-IÓIÜ,Ó.Ù Ó/ä'ØØØ!×/Ñ/Ø×)Ñ)ñ	
ð 	
rL   )r£  r8   r+   rN  r‰  rª  )rM   rN   rO   rP   r#   r   r   r   rB   rŸ   r  r   r†   r   rJ   rR   rS   rT   s   @r;   r¬  r¬  £  sJ  ø† õð Øð -1Ø15Ø15Ø15Ø15Ø/3Ø,0Ø04Ø)-Ø,0Ø/3Ø&*ñ\
à˜EŸL™LÑ)ð\
ð ! §¡Ñ.ð\
ð ! §¡Ñ.ð	\
ð
 ! §¡Ñ.ð\
ð ! §¡Ñ.ð\
ð ˜uŸ|™|Ñ,ð\
ð ˜EŸL™LÑ)ð\
ð   §¡Ñ-ð\
ð ˜Ÿ™Ñ&ð\
ð $ D™>ð\
ð ' t™nð\
ð ˜d‘^ð\
ð 
ˆuU—\‘\Ñ"Ð$<Ð<Ñ	=ô\
ó ó ö\
rL   r¬  )r†  r¬  r   rg  rM  )r   )r  N)?rQ   rd  Útypingr   r   r   rB   Útorch.utils.checkpointr   Útorch.nnr   r   r	   Úactivationsr   Úmodeling_layersr   Úmodeling_outputsr   r   r   r   r   r   Úmodeling_utilsr   r   r   r   r   Úutilsr   r   r   Úconfiguration_markuplmr   Ú
get_loggerrM   ÚloggerÚModuler   r`   rb   rŽ   r¢   r°   r·   rÀ   rÇ   rÕ   rŸ   Úfloatr÷   rù   r  r)  r9  rM  rg  r†  r   r¬  Ú__all__rB  rL   r;   Ú<module>rÃ     sg  ðñ ã 	ß ,Ñ ,ã Û Ý ß AÑ Aå !Ý 9÷÷ ÷õ ÷ ?Ñ >Ý 2ð 
×	Ò	˜HÓ	%€ô/ b—i‘iô / ôf4ô _˜Ÿ™ô _ôF˜Ÿ™ô ô˜2Ÿ9™9ô ô R—Y‘Yô ôR—Y‘Yô ô  b§i¡iô ô$˜rŸy™yô ô0!˜"Ÿ)™)ô !ð$ Ø(,ñ%ØI‰Ið%à<‰<ð%ð 
‰ð%ð <‰<ð	%ð
 ˜UŸ\™\Ñ*ð%ð ð%ð ð%ð ˜Ÿ™Ñ%õ%ô87˜BŸI™Iô 7ôv*˜Ÿ	™	ô *ô\%Ð.ô %ôR.
b—i‘iô .
ðb ô]˜oó ]ó ð]ð8 ôE
Ð+ó E
ó ðE
ðP ôj
Ð#:ó j
ó ðj
ñZ ðñô
^
Ð%<ó ^
óð
^
ñB ðñôo
Ð(?ó o
óðo
òdrL   