ó
    <±h{ˆ  ã            	       ó  • S r SSKrSSKJr  SSKJrJr  SSKrSSKrSSKJ	r	  SSK
JrJrJr  SSKJr  SS	KJr  SS
KJr  SSKJrJr  SSKJrJrJrJrJrJr  SSKJr  SSK J!r!  \" 5       (       a	  SSK"J#r#J$r$  OS r$S r#\RJ                  " \&5      r'\\" SS9 " S S\5      5       5       r(\\" SS9 " S S\5      5       5       r)\\" SS9 " S S\5      5       5       r* " S S\	RV                  5      r, " S S \	RV                  5      r- " S! S"\	RV                  5      r.SES#\R^                  S$\0S%\1S&\R^                  4S' jjr2 " S( S)\	RV                  5      r3 " S* S+\	RV                  5      r4 " S, S-\	RV                  5      r5 " S. S/\	RV                  5      r6 " S0 S1\	RV                  5      r7 " S2 S3\	RV                  5      r8 " S4 S5\	RV                  5      r9 " S6 S7\	RV                  5      r: " S8 S9\	RV                  5      r;\ " S: S;\5      5       r<\ " S< S=\<5      5       r=\" S>S9 " S? S@\<5      5       r>\" SAS9 " SB SC\<\5      5       r?/ SDQr@g)Fz9PyTorch Dilated Neighborhood Attention Transformer model.é    N)Ú	dataclass)ÚOptionalÚUnion)Únn)ÚBCEWithLogitsLossÚCrossEntropyLossÚMSELossé   )ÚACT2FN)ÚBackboneOutput)ÚPreTrainedModel)Ú find_pruneable_heads_and_indicesÚprune_linear_layer)ÚModelOutputÚOptionalDependencyNotAvailableÚauto_docstringÚis_natten_availableÚloggingÚrequires_backends)ÚBackboneMixiné   )ÚDinatConfig)Ú
natten2davÚnatten2dqkrpbc                  ó   • [        5       e©N©r   ©ÚargsÚkwargss     Ú`/var/www/html/shao/venv/lib/python3.13/site-packages/transformers/models/dinat/modeling_dinat.pyr   r   .   ó   € Ü,Ó.Ð.ó    c                  ó   • [        5       er   r   r   s     r!   r   r   1   r"   r#   zO
    Dinat encoder's outputs, with potential hidden states and attentions.
    )Úcustom_introc                   óØ   • \ rS rSr% SrSr\\R                     \	S'   Sr
\\\R                  S4      \	S'   Sr\\\R                  S4      \	S'   Sr\\\R                  S4      \	S'   S	rg)
ÚDinatEncoderOutputé;   aÕ  
reshaped_hidden_states (`tuple(torch.FloatTensor)`, *optional*, returned when `output_hidden_states=True` is passed or when `config.output_hidden_states=True`):
    Tuple of `torch.FloatTensor` (one for the output of the embeddings + one for the output of each stage) of
    shape `(batch_size, hidden_size, height, width)`.

    Hidden-states of the model at the output of each layer plus the initial embedding outputs reshaped to
    include the spatial dimensions.
NÚlast_hidden_state.Úhidden_statesÚ
attentionsÚreshaped_hidden_states© )Ú__name__Ú
__module__Ú__qualname__Ú__firstlineno__Ú__doc__r)   r   ÚtorchÚFloatTensorÚ__annotations__r*   Útupler+   r,   Ú__static_attributes__r-   r#   r!   r'   r'   ;   s}   ‡ ñð 6:Ðx × 1Ñ 1Ñ2Ó9Ø=A€M8˜E %×"3Ñ"3°SÐ"8Ñ9Ñ:ÓAØ:>€J˜˜u×0Ñ0°#Ð5Ñ6Ñ7Ó>ØFJÐ˜H U¨5×+<Ñ+<¸cÐ+AÑ%BÑCÖJr#   r'   zW
    Dinat model's outputs that also contains a pooling of the last hidden states.
    c                   ó   • \ rS rSr% SrSr\\R                     \	S'   Sr
\\R                     \	S'   Sr\\\R                  S4      \	S'   Sr\\\R                  S4      \	S'   Sr\\\R                  S4      \	S	'   S
rg)ÚDinatModelOutputéQ   a‘  
pooler_output (`torch.FloatTensor` of shape `(batch_size, hidden_size)`, *optional*, returned when `add_pooling_layer=True` is passed):
    Average pooling of the last layer hidden-state.
reshaped_hidden_states (`tuple(torch.FloatTensor)`, *optional*, returned when `output_hidden_states=True` is passed or when `config.output_hidden_states=True`):
    Tuple of `torch.FloatTensor` (one for the output of the embeddings + one for the output of each stage) of
    shape `(batch_size, hidden_size, height, width)`.

    Hidden-states of the model at the output of each layer plus the initial embedding outputs reshaped to
    include the spatial dimensions.
Nr)   Úpooler_output.r*   r+   r,   r-   )r.   r/   r0   r1   r2   r)   r   r3   r4   r5   r;   r*   r6   r+   r,   r7   r-   r#   r!   r9   r9   Q   s’   ‡ ñ	ð 6:Ðx × 1Ñ 1Ñ2Ó9Ø15€M8˜E×-Ñ-Ñ.Ó5Ø=A€M8˜E %×"3Ñ"3°SÐ"8Ñ9Ñ:ÓAØ:>€J˜˜u×0Ñ0°#Ð5Ñ6Ñ7Ó>ØFJÐ˜H U¨5×+<Ñ+<¸cÐ+AÑ%BÑCÖJr#   r9   z1
    Dinat outputs for image classification.
    c                   ó   • \ rS rSr% SrSr\\R                     \	S'   Sr
\\R                     \	S'   Sr\\\R                  S4      \	S'   Sr\\\R                  S4      \	S'   Sr\\\R                  S4      \	S	'   S
rg)ÚDinatImageClassifierOutputéj   a  
loss (`torch.FloatTensor` of shape `(1,)`, *optional*, returned when `labels` is provided):
    Classification (or regression if config.num_labels==1) loss.
logits (`torch.FloatTensor` of shape `(batch_size, config.num_labels)`):
    Classification (or regression if config.num_labels==1) scores (before SoftMax).
reshaped_hidden_states (`tuple(torch.FloatTensor)`, *optional*, returned when `output_hidden_states=True` is passed or when `config.output_hidden_states=True`):
    Tuple of `torch.FloatTensor` (one for the output of the embeddings + one for the output of each stage) of
    shape `(batch_size, hidden_size, height, width)`.

    Hidden-states of the model at the output of each layer plus the initial embedding outputs reshaped to
    include the spatial dimensions.
NÚlossÚlogits.r*   r+   r,   r-   )r.   r/   r0   r1   r2   r?   r   r3   r4   r5   r@   r*   r6   r+   r,   r7   r-   r#   r!   r=   r=   j   s‘   ‡ ñð )-€Dˆ(5×$Ñ$Ñ
%Ó,Ø*.€FˆHU×&Ñ&Ñ'Ó.Ø=A€M8˜E %×"3Ñ"3°SÐ"8Ñ9Ñ:ÓAØ:>€J˜˜u×0Ñ0°#Ð5Ñ6Ñ7Ó>ØFJÐ˜H U¨5×+<Ñ+<¸cÐ+AÑ%BÑCÖJr#   r=   c                   ór   ^ • \ rS rSrSrU 4S jrS\\R                     S\	\R                     4S jrSrU =r$ )ÚDinatEmbeddingsé…   z.
Construct the patch and position embeddings.
c                 óÖ   >• [         TU ]  5         [        U5      U l        [        R
                  " UR                  5      U l        [        R                  " UR                  5      U l
        g r   )ÚsuperÚ__init__ÚDinatPatchEmbeddingsÚpatch_embeddingsr   Ú	LayerNormÚ	embed_dimÚnormÚDropoutÚhidden_dropout_probÚdropout©ÚselfÚconfigÚ	__class__s     €r!   rF   ÚDinatEmbeddings.__init__Š   sG   ø€ Ü‰ÑÔä 4°VÓ <ˆÔä—L’L ×!1Ñ!1Ó2ˆŒ	Ü—z’z &×"<Ñ"<Ó=ˆr#   Úpixel_valuesÚreturnc                 ól   • U R                  U5      nU R                  U5      nU R                  U5      nU$ r   )rH   rK   rN   )rP   rT   Ú
embeddingss      r!   ÚforwardÚDinatEmbeddings.forward’   s4   € Ø×*Ñ*¨<Ó8ˆ
Ø—Y‘Y˜zÓ*ˆ
à—\‘\ *Ó-ˆ
àÐr#   )rN   rK   rH   )r.   r/   r0   r1   r2   rF   r   r3   r4   r6   ÚTensorrX   r7   Ú__classcell__©rR   s   @r!   rB   rB   …   s9   ø† ñõ>ð H¨U×->Ñ->Ñ$?ð ÀEÈ%Ï,É,ÑDW÷ ò r#   rB   c                   ól   ^ • \ rS rSrSrU 4S jrS\\R                     S\R                  4S jr
SrU =r$ )rG   é›   zß
This class turns `pixel_values` of shape `(batch_size, num_channels, height, width)` into the initial
`hidden_states` (patch embeddings) of shape `(batch_size, height, width, hidden_size)` to be consumed by a
Transformer.
c                 óH  >• [         TU ]  5         UR                  nUR                  UR                  pCX0l        US:X  a  O[        S5      e[        R                  " [        R                  " U R                  US-  SSSS9[        R                  " US-  USSSS95      U l	        g )Né   z2Dinat only supports patch size of 4 at the moment.é   ©r
   r
   ©ra   ra   ©r   r   )Úkernel_sizeÚstrideÚpadding)
rE   rF   Ú
patch_sizeÚnum_channelsrJ   Ú
ValueErrorr   Ú
SequentialÚConv2dÚ
projection)rP   rQ   rh   ri   Úhidden_sizerR   s        €r!   rF   ÚDinatPatchEmbeddings.__init__¢   s–   ø€ Ü‰ÑÔØ×&Ñ&ˆ
Ø$*×$7Ñ$7¸×9IÑ9IkØ(Ôà˜‹?Øô ÐQÓRÐRäŸ-š-ÜIŠId×'Ñ'¨¸Ñ)9ÀvÐV\ÐflÑmÜIŠIk QÑ&¨ÀÐPVÐ`fÑgó
ˆr#   rT   rU   c                 ó¢   • UR                   u  p#pEX0R                  :w  a  [        S5      eU R                  U5      nUR	                  SSSS5      nU$ )NzeMake sure that the channel dimension of the pixel values match with the one set in the configuration.r   ra   r
   r   )Úshaperi   rj   rm   Úpermute)rP   rT   Ú_ri   ÚheightÚwidthrW   s          r!   rX   ÚDinatPatchEmbeddings.forward³   sZ   € Ø)5×);Ñ);Ñ&ˆ˜Ø×,Ñ,Ó,ÜØwóð ð —_‘_ \Ó2ˆ
Ø×'Ñ'¨¨1¨a°Ó3ˆ
àÐr#   )ri   rm   )r.   r/   r0   r1   r2   rF   r   r3   r4   rZ   rX   r7   r[   r\   s   @r!   rG   rG   ›   s4   ø† ñõ
ð"	 H¨U×->Ñ->Ñ$?ð 	ÀEÇLÁL÷ 	ò 	r#   rG   c                   ó¤   ^ • \ rS rSrSr\R                  4S\S\R                  SS4U 4S jjjr	S\
R                  S\
R                  4S	 jrS
rU =r$ )ÚDinatDownsampleré¿   zÆ
Convolutional Downsampling Layer.

Args:
    dim (`int`):
        Number of input channels.
    norm_layer (`nn.Module`, *optional*, defaults to `nn.LayerNorm`):
        Normalization layer class.
ÚdimÚ
norm_layerrU   Nc           	      ó   >• [         TU ]  5         Xl        [        R                  " USU-  SSSSS9U l        U" SU-  5      U l        g )Nra   rb   rc   rd   F)re   rf   rg   Úbias)rE   rF   rz   r   rl   Ú	reductionrK   )rP   rz   r{   rR   s      €r!   rF   ÚDinatDownsampler.__init__Ê   sC   ø€ Ü‰ÑÔØŒÜŸš 3¨¨C©¸VÈFÐ\bÐinÑoˆŒÙ˜q 3™wÓ'ˆ	r#   Úinput_featurec                 ó’   • U R                  UR                  SSSS5      5      R                  SSSS5      nU R                  U5      nU$ )Nr   r
   r   ra   )r~   rr   rK   )rP   r€   s     r!   rX   ÚDinatDownsampler.forwardÐ   sJ   € ØŸ™ }×'<Ñ'<¸QÀÀ1ÀaÓ'HÓI×QÑQÐRSÐUVÐXYÐ[\Ó]ˆØŸ	™	 -Ó0ˆØÐr#   )rz   rK   r~   )r.   r/   r0   r1   r2   r   rI   ÚintÚModulerF   r3   rZ   rX   r7   r[   r\   s   @r!   rx   rx   ¿   sT   ø† ñð :<¿¹ñ (˜Cð (¨R¯Y©Yð (È$÷ (ð (ð U§\¡\ð °e·l±l÷ ò r#   rx   ÚinputÚ	drop_probÚtrainingrU   c                 ó  • US:X  d  U(       d  U $ SU-
  nU R                   S   4SU R                  S-
  -  -   nU[        R                  " X@R                  U R
                  S9-   nUR                  5         U R                  U5      U-  nU$ )a*  
Drop paths (Stochastic Depth) per sample (when applied in main path of residual blocks).

Comment by Ross Wightman: This is the same as the DropConnect impl I created for EfficientNet, etc networks,
however, the original name is misleading as 'Drop Connect' is a different form of dropout in a separate paper...
See discussion: https://github.com/tensorflow/tpu/issues/494#issuecomment-532968956 ... I've opted for changing the
layer and argument names to 'drop path' rather than mix DropConnect as a layer name and use 'survival rate' as the
argument.
ç        r   r   )r   )ÚdtypeÚdevice)rq   Úndimr3   ÚrandrŠ   r‹   Úfloor_Údiv)r…   r†   r‡   Ú	keep_probrq   Úrandom_tensorÚoutputs          r!   Ú	drop_pathr“   ×   s   € ð CÓžxØˆØI‘€IØ[‰[˜‰^Ð ¨¯
©
°Q©Ñ 7Ñ7€EØ¤§
¢
¨5¿¹ÈEÏLÉLÑ YÑY€MØ×ÑÔØY‰YyÓ! MÑ1€FØ€Mr#   c                   óŠ   ^ • \ rS rSrSrSS\\   SS4U 4S jjjrS\R                  S\R                  4S jr
S\4S	 jrS
rU =r$ )ÚDinatDropPathéì   zXDrop paths (Stochastic Depth) per sample (when applied in main path of residual blocks).Nr†   rU   c                 ó.   >• [         TU ]  5         Xl        g r   )rE   rF   r†   )rP   r†   rR   s     €r!   rF   ÚDinatDropPath.__init__ï   s   ø€ Ü‰ÑÔØ"r#   r*   c                 óB   • [        XR                  U R                  5      $ r   )r“   r†   r‡   ©rP   r*   s     r!   rX   ÚDinatDropPath.forwardó   s   € Ü˜¯©¸¿¹ÓFÐFr#   c                 ó    • SU R                    3$ )Nzp=©r†   ©rP   s    r!   Ú
extra_reprÚDinatDropPath.extra_reprö   s   € ØD—N‘NÐ#Ð$Ð$r#   r   r   )r.   r/   r0   r1   r2   r   ÚfloatrF   r3   rZ   rX   ÚstrrŸ   r7   r[   r\   s   @r!   r•   r•   ì   sQ   ø† Ùbñ# (¨5¡/ð #¸T÷ #ð #ðG U§\¡\ð G°e·l±lô Gð%˜C÷ %ò %r#   r•   c                   óx   ^ • \ rS rSrU 4S jr SS\R                  S\\   S\	\R                     4S jjr
SrU =r$ )	ÚNeighborhoodAttentionéú   c                 ó  >• [         TU ]  5         X#-  S:w  a  [        SU SU S35      eX0l        [	        X#-  5      U l        U R                  U R
                  -  U l        X@l        XPl        [        R                  " [        R                  " USU R                  -  S-
  SU R                  -  S-
  5      5      U l        [        R                  " U R                  U R                  UR                  S9U l        [        R                  " U R                  U R                  UR                  S9U l        [        R                  " U R                  U R                  UR                  S9U l        [        R&                  " UR(                  5      U l        g )Nr   zThe hidden size (z6) is not a multiple of the number of attention heads (Ú)ra   r   )r}   )rE   rF   rj   Únum_attention_headsrƒ   Úattention_head_sizeÚall_head_sizere   Údilationr   Ú	Parameterr3   ÚzerosÚrpbÚLinearÚqkv_biasÚqueryÚkeyÚvaluerL   Úattention_probs_dropout_probrN   ©rP   rQ   rz   Ú	num_headsre   r«   rR   s         €r!   rF   ÚNeighborhoodAttention.__init__û   s:  ø€ Ü‰ÑÔØ‰?˜aÓÜØ# C 5Ð(^Ð_hÐ^iÐijÐkóð ð $-Ô Ü#& s¡Ó#7ˆÔ Ø!×5Ñ5¸×8PÑ8PÑPˆÔØ&ÔØ Œô —<’<¤§¢¨I¸¸D×<LÑ<LÑ8LÈqÑ8PÐTUÐX\×XhÑXhÑThÐklÑTlÓ nÓoˆŒä—Y’Y˜t×1Ñ1°4×3EÑ3EÈFÏOÉOÑ\ˆŒ
Ü—9’9˜T×/Ñ/°×1CÑ1CÈ&Ï/É/ÑZˆŒÜ—Y’Y˜t×1Ñ1°4×3EÑ3EÈFÏOÉOÑ\ˆŒ
ä—z’z &×"EÑ"EÓFˆr#   r*   Úoutput_attentionsrU   c                 óÔ  • UR                   u  p4nU R                  U5      R                  USU R                  U R                  5      R                  SS5      nU R                  U5      R                  USU R                  U R                  5      R                  SS5      nU R                  U5      R                  USU R                  U R                  5      R                  SS5      nU[        R                  " U R                  5      -  n[        XgU R                  U R                  U R                  5      n	[        R                  R!                  U	SS9n
U R#                  U
5      n
[%        X¨U R                  U R                  5      nUR'                  SSSSS5      R)                  5       nUR+                  5       S S U R,                  4-   nUR                  U5      nU(       a  Xº4nU$ U4nU$ )	Néÿÿÿÿr   ra   ©rz   r   r
   r`   éþÿÿÿ)rq   r±   Úviewr¨   r©   Ú	transposer²   r³   ÚmathÚsqrtr   r®   re   r«   r   Ú
functionalÚsoftmaxrN   r   rr   Ú
contiguousÚsizerª   )rP   r*   r¸   Ú
batch_sizeÚ
seq_lengthrs   Úquery_layerÚ	key_layerÚvalue_layerÚattention_scoresÚattention_probsÚcontext_layerÚnew_context_layer_shapeÚoutputss                 r!   rX   ÚNeighborhoodAttention.forward  s¼  € ð
 %2×$7Ñ$7Ñ!ˆ
 àJ‰J}Ó%ß‰T*˜b $×":Ñ":¸D×<TÑ<TÓUß‰Yq˜!‹_ð 	ð H‰H]Ó#ß‰T*˜b $×":Ñ":¸D×<TÑ<TÓUß‰Yq˜!‹_ð 	ð J‰J}Ó%ß‰T*˜b $×":Ñ":¸D×<TÑ<TÓUß‰Yq˜!‹_ð 	ð "¤D§I¢I¨d×.FÑ.FÓ$GÑGˆô )¨ÀÇÁÈ4×K[ÑK[Ð]a×]jÑ]jÓkÐô Ÿ-™-×/Ñ/Ð0@ÀbÐ/ÐIˆð Ÿ,™, Ó7ˆä" ?À×AQÑAQÐSW×S`ÑS`ÓaˆØ%×-Ñ-¨a°°A°q¸!Ó<×GÑGÓIˆØ"/×"4Ñ"4Ó"6°s¸Ð";¸t×?QÑ?QÐ>SÑ"SÐØ%×*Ñ*Ð+BÓCˆæ6G=Ð2ˆàˆð O\ÐM]ˆàˆr#   )
rª   r©   r«   rN   re   r²   r¨   r±   r®   r³   ©F©r.   r/   r0   r1   rF   r3   rZ   r   Úboolr6   rX   r7   r[   r\   s   @r!   r¤   r¤   ú   sE   ø† õGð2 -2ñ,à—|‘|ð,ð $ D™>ð,ð 
ˆu|‰|Ñ	÷	,ó ,r#   r¤   c                   óz   ^ • \ rS rSrU 4S jrS\R                  S\R                  S\R                  4S jrSrU =r	$ )ÚNeighborhoodAttentionOutputi@  c                 ó¢   >• [         TU ]  5         [        R                  " X"5      U l        [        R
                  " UR                  5      U l        g r   )rE   rF   r   r¯   ÚdenserL   r´   rN   ©rP   rQ   rz   rR   s      €r!   rF   Ú$NeighborhoodAttentionOutput.__init__A  s4   ø€ Ü‰ÑÔÜ—Y’Y˜sÓ(ˆŒ
Ü—z’z &×"EÑ"EÓFˆr#   r*   Úinput_tensorrU   c                 óJ   • U R                  U5      nU R                  U5      nU$ r   ©rÖ   rN   )rP   r*   rÙ   s      r!   rX   Ú#NeighborhoodAttentionOutput.forwardF  s$   € ØŸ
™
 =Ó1ˆØŸ™ ]Ó3ˆàÐr#   rÛ   ©
r.   r/   r0   r1   rF   r3   rZ   rX   r7   r[   r\   s   @r!   rÔ   rÔ   @  s7   ø† õGð
 U§\¡\ð ÀÇÁð ÐRW×R^ÑR^÷ ò r#   rÔ   c                   ó~   ^ • \ rS rSrU 4S jrS r S	S\R                  S\\	   S\
\R                     4S jjrSrU =r$ )
ÚNeighborhoodAttentionModuleiM  c                 ó„   >• [         TU ]  5         [        XX4U5      U l        [	        X5      U l        [        5       U l        g r   )rE   rF   r¤   rP   rÔ   r’   ÚsetÚpruned_headsrµ   s         €r!   rF   Ú$NeighborhoodAttentionModule.__init__N  s4   ø€ Ü‰ÑÔÜ)¨&°yÈxÓXˆŒ	Ü1°&Ó>ˆŒÜ›EˆÕr#   c                 ó6  • [        U5      S:X  a  g [        XR                  R                  U R                  R                  U R
                  5      u  p[        U R                  R                  U5      U R                  l        [        U R                  R                  U5      U R                  l        [        U R                  R                  U5      U R                  l	        [        U R                  R                  USS9U R                  l        U R                  R                  [        U5      -
  U R                  l        U R                  R                  U R                  R                  -  U R                  l        U R
                  R                  U5      U l        g )Nr   r   r»   )Úlenr   rP   r¨   r©   râ   r   r±   r²   r³   r’   rÖ   rª   Úunion)rP   ÚheadsÚindexs      r!   Úprune_headsÚ'NeighborhoodAttentionModule.prune_headsT  s  € Üˆu‹:˜‹?ØÜ7Ø—9‘9×0Ñ0°$·)±)×2OÑ2OÐQU×QbÑQbó
‰ˆô
 -¨T¯Y©Y¯_©_¸eÓDˆ	‰	ŒÜ*¨4¯9©9¯=©=¸%Ó@ˆ	‰	ŒÜ,¨T¯Y©Y¯_©_¸eÓDˆ	‰	ŒÜ.¨t¯{©{×/@Ñ/@À%ÈQÑOˆ‰Ôð )-¯	©	×(EÑ(EÌÈEË
Ñ(Rˆ	‰	Ô%Ø"&§)¡)×"?Ñ"?À$Ç)Á)×B_ÑB_Ñ"_ˆ	‰	ÔØ ×-Ñ-×3Ñ3°EÓ:ˆÕr#   r*   r¸   rU   c                 ód   • U R                  X5      nU R                  US   U5      nU4USS  -   nU$ ©Nr   r   )rP   r’   )rP   r*   r¸   Úself_outputsÚattention_outputrÎ   s         r!   rX   Ú#NeighborhoodAttentionModule.forwardf  s@   € ð
 —y‘y ÓBˆØŸ;™; |°A¡¸ÓFÐØ#Ð%¨°Q°RÐ(8Ñ8ˆØˆr#   )r’   râ   rP   rÐ   )r.   r/   r0   r1   rF   ré   r3   rZ   r   rÒ   r6   rX   r7   r[   r\   s   @r!   rß   rß   M  sI   ø† õ"ò;ð* -2ñà—|‘|ðð $ D™>ðð 
ˆu|‰|Ñ	÷	ó r#   rß   c                   ób   ^ • \ rS rSrU 4S jrS\R                  S\R                  4S jrSrU =r	$ )ÚDinatIntermediateiq  c                 ó  >• [         TU ]  5         [        R                  " U[	        UR
                  U-  5      5      U l        [        UR                  [        5      (       a  [        UR                     U l        g UR                  U l        g r   )rE   rF   r   r¯   rƒ   Ú	mlp_ratiorÖ   Ú
isinstanceÚ
hidden_actr¢   r   Úintermediate_act_fnr×   s      €r!   rF   ÚDinatIntermediate.__init__r  sd   ø€ Ü‰ÑÔÜ—Y’Y˜s¤C¨×(8Ñ(8¸3Ñ(>Ó$?Ó@ˆŒ
Üf×'Ñ'¬×-Ñ-Ü'-¨f×.?Ñ.?Ñ'@ˆDÕ$à'-×'8Ñ'8ˆDÕ$r#   r*   rU   c                 óJ   • U R                  U5      nU R                  U5      nU$ r   ©rÖ   rö   rš   s     r!   rX   ÚDinatIntermediate.forwardz  s&   € ØŸ
™
 =Ó1ˆØ×0Ñ0°Ó?ˆØÐr#   rù   rÝ   r\   s   @r!   rñ   rñ   q  s(   ø† õ9ð U§\¡\ð °e·l±l÷ ò r#   rñ   c                   ób   ^ • \ rS rSrU 4S jrS\R                  S\R                  4S jrSrU =r	$ )ÚDinatOutputi€  c                 óÐ   >• [         TU ]  5         [        R                  " [	        UR
                  U-  5      U5      U l        [        R                  " UR                  5      U l	        g r   )
rE   rF   r   r¯   rƒ   ró   rÖ   rL   rM   rN   r×   s      €r!   rF   ÚDinatOutput.__init__  sF   ø€ Ü‰ÑÔÜ—Y’Yœs 6×#3Ñ#3°cÑ#9Ó:¸CÓ@ˆŒ
Ü—z’z &×"<Ñ"<Ó=ˆr#   r*   rU   c                 óJ   • U R                  U5      nU R                  U5      nU$ r   rÛ   rš   s     r!   rX   ÚDinatOutput.forward†  s$   € ØŸ
™
 =Ó1ˆØŸ™ ]Ó3ˆØÐr#   rÛ   rÝ   r\   s   @r!   rü   rü   €  s(   ø† õ>ð
 U§\¡\ð °e·l±l÷ ò r#   rü   c            	       óš   ^ • \ rS rSrS	U 4S jjrS r S
S\R                  S\\	   S\
\R                  \R                  4   4S jjrSrU =r$ )Ú
DinatLayeriŒ  c                 óÂ  >• [         TU ]  5         UR                  U l        UR                  U l        X@l        U R                  U R                  -  U l        [        R                  " X!R                  S9U l	        [        XX0R                  U R                  S9U l        US:”  a  [        U5      O[        R                  " 5       U l        [        R                  " X!R                  S9U l        [!        X5      U l        [%        X5      U l        UR(                  S:”  a>  [        R*                  " UR(                  [,        R.                  " SU45      -  SS9U l        g S U l        g )N©Úeps)re   r«   r‰   r   ra   T)Úrequires_grad)rE   rF   Úchunk_size_feed_forwardre   r«   Úwindow_sizer   rI   Úlayer_norm_epsÚlayernorm_beforerß   Ú	attentionr•   ÚIdentityr“   Úlayernorm_afterrñ   Úintermediaterü   r’   Úlayer_scale_init_valuer¬   r3   ÚonesÚlayer_scale_parameters)rP   rQ   rz   r¶   r«   Údrop_path_raterR   s         €r!   rF   ÚDinatLayer.__init__  s  ø€ Ü‰ÑÔØ'-×'EÑ'EˆÔ$Ø!×-Ñ-ˆÔØ ŒØ×+Ñ+¨d¯m©mÑ;ˆÔÜ "§¢¨S×6KÑ6KÑ LˆÔÜ4Ø˜×0@Ñ0@È4Ï=É=ñ
ˆŒð ;IÈ3Ó:Nœ ~Ô6ÔTV×T_ÒT_ÓTaˆŒÜ!Ÿ|š|¨C×5JÑ5JÑKˆÔÜ-¨fÓ:ˆÔÜ! &Ó.ˆŒð ×,Ñ,¨qÓ0ô LŠL˜×6Ñ6¼¿ºÀQÈÀHÓ9MÑMÐ]aÑbð 	Õ#ð ð 	Õ#r#   c                 óÀ   • U R                   nSnX$:  d  X4:  aD  S=pg[        SXC-
  5      n[        SXB-
  5      n	SSXhXy4n[        R                  R	                  X5      nX4$ )N)r   r   r   r   r   r   r   )r  Úmaxr   rÁ   Úpad)
rP   r*   rt   ru   r  Ú
pad_valuesÚpad_lÚpad_tÚpad_rÚpad_bs
             r!   Ú	maybe_padÚDinatLayer.maybe_pad¡  sn   € Ø×&Ñ&ˆØ'ˆ
ØÓ 5Ó#6ØÐˆEÜ˜˜;Ñ.Ó/ˆEÜ˜˜;Ñ/Ó0ˆEØ˜Q ¨eÐ;ˆJÜŸM™M×-Ñ-¨mÓHˆMØÐ(Ð(r#   r*   r¸   rU   c                 óˆ  • UR                  5       u  p4pVUnU R                  U5      nU R                  XU5      u  pUR                  u  pšp¹U R	                  XS9nUS   nUS   S:„  =(       d    US   S:„  nU(       a  US S 2S U2S U2S S 24   R                  5       nU R                  b  U R                  S   U-  nXpR                  U5      -   nU R                  U5      nU R                  U R                  U5      5      nU R                  b  U R                  S   U-  nXR                  U5      -   nU(       a  XüS   4nU$ U4nU$ )N)r¸   r   r
   é   r   )rÄ   r
  r  rq   r  rÃ   r  r“   r  r’   r  )rP   r*   r¸   rÅ   rt   ru   ÚchannelsÚshortcutr  rs   Ú
height_padÚ	width_padÚattention_outputsrî   Ú
was_paddedÚlayer_outputÚlayer_outputss                    r!   rX   ÚDinatLayer.forward¬  sf  € ð
 /<×.@Ñ.@Ó.BÑ+ˆ
˜EØ ˆà×-Ñ-¨mÓ<ˆà$(§N¡N°=È%Ó$PÑ!ˆà&3×&9Ñ&9Ñ#ˆyà ŸN™N¨=˜NÐ^Ðà,¨QÑ/Ðà ‘] QÑ&×;¨*°Q©-¸!Ñ*;ˆ
ÞØ/²°7°F°7¸F¸U¸FÂAÐ0EÑF×QÑQÓSÐà×&Ñ&Ñ2Ø#×:Ñ:¸1Ñ=Ð@PÑPÐà §>¡>Ð2BÓ#CÑCˆà×+Ñ+¨MÓ:ˆØ—{‘{ 4×#4Ñ#4°\Ó#BÓCˆà×&Ñ&Ñ2Ø×6Ñ6°qÑ9¸LÑHˆLà$§~¡~°lÓ'CÑCˆæ@Q˜¸Ñ';Ð<ˆØÐð YeÐWfˆØÐr#   )r  r  r«   r“   r  re   r  r  r
  r’   r  )r‰   rÐ   )r.   r/   r0   r1   rF   r  r3   rZ   r   rÒ   r6   rX   r7   r[   r\   s   @r!   r  r  Œ  sR   ø† ÷
ò(	)ð -2ñ$à—|‘|ð$ð $ D™>ð$ð 
ˆu|‰|˜UŸ\™\Ð)Ñ	*÷	$ó $r#   r  c                   óx   ^ • \ rS rSrU 4S jr SS\R                  S\\   S\	\R                     4S jjr
SrU =r$ )	Ú
DinatStageiÓ  c                 ó"  >• [         T	U ]  5         Xl        X l        [        R
                  " [        U5       Vs/ sH  n[        UUUXX   Xh   S9PM     sn5      U l        Ub  U" U[        R                  S9U l
        OS U l
        SU l        g s  snf )N)rQ   rz   r¶   r«   r  )rz   r{   F)rE   rF   rQ   rz   r   Ú
ModuleListÚranger  ÚlayersrI   Ú
downsampleÚpointing)
rP   rQ   rz   Údepthr¶   Ú	dilationsr  r/  ÚirR   s
            €r!   rF   ÚDinatStage.__init__Ô  s“   ø€ Ü‰ÑÔØŒØŒÜ—m’mô ˜uœó	ñ &Aô Ø!ØØ'Ø&™\Ø#1Ñ#4ôñ &ñ	ó
ˆŒð Ñ!Ù(¨S¼R¿\¹\ÑJˆDOà"ˆDŒOàˆùò%	s   ¹Br*   r¸   rU   c                 óæ   • UR                  5       u  p4pS[        U R                  5       H  u  pgU" X5      nUS   nM     Un	U R                  b  U R                  U	5      nX4n
U(       a  U
WSS  -  n
U
$ rì   )rÄ   Ú	enumerater.  r/  )rP   r*   r¸   rs   rt   ru   r3  Úlayer_moduler'  Ú!hidden_states_before_downsamplingÚstage_outputss              r!   rX   ÚDinatStage.forwardí  sƒ   € ð
 ,×0Ñ0Ó2Ñˆ5Ü(¨¯©Ö5‰OˆAÙ(¨ÓJˆMØ)¨!Ñ,ŠMñ  6ð -:Ð)Ø?‰?Ñ&Ø ŸO™OÐ,MÓNˆMà&ÐJˆæØ˜]¨1¨2Ð.Ñ.ˆMØÐr#   )rQ   rz   r/  r.  r0  rÐ   rÑ   r\   s   @r!   r*  r*  Ó  sD   ø† õð8 -2ñà—|‘|ðð $ D™>ðð 
ˆu|‰|Ñ	÷	ó r#   r*  c                   óŒ   ^ • \ rS rSrU 4S jr    SS\R                  S\\   S\\   S\\   S\\   S\	\
\4   4S	 jjrS
rU =r$ )ÚDinatEncoderi  c                 óÀ  >• [         TU ]  5         [        UR                  5      U l        Xl        [        R                  " SUR                  [        UR                  5      SS9 Vs/ sH  o"R                  5       PM     nn[        R                  " [        U R                  5       Vs/ sHœ  n[        U[        UR                   SU-  -  5      UR                  U   UR"                  U   UR$                  U   U[        UR                  S U 5      [        UR                  S US-    5       X@R                  S-
  :  a  [&        OS S9PMž     sn5      U l        g s  snf s  snf )Nr   Úcpu)r‹   ra   r   )rQ   rz   r1  r¶   r2  r  r/  )rE   rF   rå   ÚdepthsÚ
num_levelsrQ   r3   Úlinspacer  ÚsumÚitemr   r,  r-  r*  rƒ   rJ   r¶   r2  rx   Úlevels)rP   rQ   ÚxÚdprÚi_layerrR   s        €r!   rF   ÚDinatEncoder.__init__  s0  ø€ Ü‰ÑÔÜ˜fŸm™mÓ,ˆŒØŒÜ!&§¢°°6×3HÑ3HÌ#ÈfÏmÉmÓJ\ÐejÒ!kÓlÑ!k˜Av‰vŽxÑ!kˆÐlÜ—m’mô  % T§_¡_Ô5óñ  6Gô Ø!Ü˜F×,Ñ,¨q°'©zÑ9Ó:Ø Ÿ-™-¨Ñ0Ø$×.Ñ.¨wÑ7Ø$×.Ñ.¨wÑ7Ø#&¤s¨6¯=©=¸¸'Ð+BÓ'CÄcÈ&Ï-É-ÐXeÐZaÐdeÑZeÐJfÓFgÐ#hØ4;¿o¹oÐPQÑ>QÓ4QÕ/ÐX\ôñ  6ñó
ˆùò mùòs   Á&EÂ'B"Er*   r¸   Úoutput_hidden_statesÚ(output_hidden_states_before_downsamplingÚreturn_dictrU   c                 ó  • U(       a  SOS nU(       a  SOS nU(       a  SOS nU(       a  UR                  SSSS5      n	Xa4-  nXy4-  n[        U R                  5       H€  u  p«U" X5      nUS   nUS   nU(       a&  U(       a  UR                  SSSS5      n	Xm4-  nXy4-  nO,U(       a%  U(       d  UR                  SSSS5      n	Xa4-  nXy4-  nU(       d  My  XŒSS  -  nM‚     U(       d  [        S XU4 5       5      $ [	        UUUUS9$ )Nr-   r   r
   r   ra   c              3   ó,   #   • U H  oc  M  Uv •  M     g 7fr   r-   )Ú.0Úvs     r!   Ú	<genexpr>Ú'DinatEncoder.forward.<locals>.<genexpr>>  s   é € ÐmÑ$[˜qŸ™Ò$[ùs   ‚‹	)r)   r*   r+   r,   )rr   r6  rD  r6   r'   )rP   r*   r¸   rI  rJ  rK  Úall_hidden_statesÚall_reshaped_hidden_statesÚall_self_attentionsÚreshaped_hidden_stater3  r7  r'  r8  s                 r!   rX   ÚDinatEncoder.forward  sA  € ö #7™B¸DÐÞ+?¡RÀTÐ"Þ$5™b¸4Ðæà$1×$9Ñ$9¸!¸QÀÀ1Ó$EÐ!ØÐ!1Ñ1ÐØ&Ð*BÑBÐ&ä(¨¯©Ö5‰OˆAÙ(¨ÓJˆMà)¨!Ñ,ˆMØ0=¸aÑ0@Ð-æ#Ö(Pà(I×(QÑ(QÐRSÐUVÐXYÐ[\Ó(]Ð%Ø!Ð%IÑIÐ!Ø*Ð.FÑFÑ*Þ%Ö.Và(5×(=Ñ(=¸aÀÀAÀqÓ(IÐ%Ø!Ð%5Ñ5Ð!Ø*Ð.FÑFÐ*ç Ð Ø#°Q°RÐ'8Ñ8Ò#ñ%  6ö( ÜÑm ]ÐGZÑ$[ÓmÓmÐmä!Ø+Ø+Ø*Ø#=ñ	
ð 	
r#   )rQ   rD  r@  )FFFT)r.   r/   r0   r1   rF   r3   rZ   r   rÒ   r   r6   r'   rX   r7   r[   r\   s   @r!   r<  r<    sy   ø† õ
ð. -2Ø/4ØCHØ&*ñ.
à—|‘|ð.
ð $ D™>ð.
ð ' t™nð	.
ð
 3;¸4±.ð.
ð ˜d‘^ð.
ð 
ˆuÐ(Ð(Ñ	)÷.
ó .
r#   r<  c                   ó.   • \ rS rSr% \\S'   SrSrS rSr	g)ÚDinatPreTrainedModeliH  rQ   ÚdinatrT   c                 ó
  • [        U[        R                  [        R                  45      (       ak  UR                  R
                  R                  SU R                  R                  S9  UR                  b%  UR                  R
                  R                  5         gg[        U[        R                  5      (       aJ  UR                  R
                  R                  5         UR                  R
                  R                  S5        gg)zInitialize the weightsr‰   )ÚmeanÚstdNg      ð?)rô   r   r¯   rl   ÚweightÚdataÚnormal_rQ   Úinitializer_ranger}   Úzero_rI   Úfill_)rP   Úmodules     r!   Ú_init_weightsÚ"DinatPreTrainedModel._init_weightsN  s®   € äfœrŸy™y¬"¯)©)Ð4×5Ñ5ð M‰M×Ñ×&Ñ&¨C°T·[±[×5RÑ5RÐ&ÑSØ{‰{Ñ&Ø—‘× Ñ ×&Ñ&Õ(ð 'ä˜¤§¡×-Ñ-ØK‰K×Ñ×"Ñ"Ô$ØM‰M×Ñ×$Ñ$ SÕ)ð .r#   r-   N)
r.   r/   r0   r1   r   r5   Úbase_model_prefixÚmain_input_namerd  r7   r-   r#   r!   rX  rX  H  s   ‡ àÓØÐØ$€Oõ
*r#   rX  c                   ó¢   ^ • \ rS rSrSU 4S jjrS rS r\    SS\\	R                     S\\   S\\   S\\   S	\\\4   4
S
 jj5       rSrU =r$ )Ú
DinatModeli[  c                 óÜ  >• [         TU ]  U5        [        U S/5        Xl        [	        UR
                  5      U l        [        UR                  SU R                  S-
  -  -  5      U l	        [        U5      U l        [        U5      U l        [        R                  " U R                  UR                   S9U l        U(       a  [        R$                  " S5      OSU l        U R)                  5         g)z^
add_pooling_layer (bool, *optional*, defaults to `True`):
    Whether to add a pooling layer
Únattenra   r   r  N)rE   rF   r   rQ   rå   r?  r@  rƒ   rJ   Únum_featuresrB   rW   r<  Úencoderr   rI   r	  Ú	layernormÚAdaptiveAvgPool1dÚpoolerÚ	post_init)rP   rQ   Úadd_pooling_layerrR   s      €r!   rF   ÚDinatModel.__init__]  s±   ø€ ô
 	‰Ñ˜Ô ä˜$  
Ô+àŒÜ˜fŸm™mÓ,ˆŒÜ × 0Ñ 0°1¸¿¹È1Ñ9LÑ3MÑ MÓNˆÔä)¨&Ó1ˆŒÜ# FÓ+ˆŒäŸš d×&7Ñ&7¸V×=RÑ=RÑSˆŒÞ1B”b×*Ò*¨1Ô-ÈˆŒð 	‰Õr#   c                 ó.   • U R                   R                  $ r   ©rW   rH   rž   s    r!   Úget_input_embeddingsÚDinatModel.get_input_embeddingss  ó   € Ø‰×/Ñ/Ð/r#   c                 óš   • UR                  5        H7  u  p#U R                  R                  U   R                  R	                  U5        M9     g)z…
Prunes heads of the model. heads_to_prune: dict of {layer_num: list of heads to prune in this layer} See base
class PreTrainedModel
N)Úitemsrm  Úlayerr  ré   )rP   Úheads_to_pruner{  rç   s       r!   Ú_prune_headsÚDinatModel._prune_headsv  s<   € ð
 +×0Ñ0Ö2‰LˆEØL‰L×Ñ˜uÑ%×/Ñ/×;Ñ;¸EÖBò 3r#   rT   r¸   rI  rK  rU   c                 óZ  • Ub  UOU R                   R                  nUb  UOU R                   R                  nUb  UOU R                   R                  nUc  [	        S5      eU R                  U5      nU R                  UUUUS9nUS   nU R                  U5      nS nU R                  bH  U R                  UR                  SS5      R                  SS5      5      n[        R                  " US5      nU(       d  Xx4USS  -   n	U	$ [        UUUR                  UR                  UR                  S9$ )Nz You have to specify pixel_values©r¸   rI  rK  r   r   ra   )r)   r;   r*   r+   r,   )rQ   r¸   rI  Úuse_return_dictrj   rW   rm  rn  rp  Úflattenr¾   r3   r9   r*   r+   r,   )
rP   rT   r¸   rI  rK  Úembedding_outputÚencoder_outputsÚsequence_outputÚpooled_outputr’   s
             r!   rX   ÚDinatModel.forward~  s?  € ð 2CÑ1NÑ-ÐTX×T_ÑT_×TqÑTqÐà$8Ñ$DÑ È$Ï+É+×JjÑJjð 	ð &1Ñ%<‘kÀ$Ç+Á+×B]ÑB]ˆàÑÜÐ?Ó@Ð@àŸ?™?¨<Ó8ÐàŸ,™,ØØ/Ø!5Ø#ð	 'ð 
ˆð *¨!Ñ,ˆØŸ.™.¨Ó9ˆàˆØ;‰;Ñ"Ø ŸK™K¨×(?Ñ(?ÀÀ1Ó(E×(OÑ(OÐPQÐSTÓ(UÓVˆMÜ!ŸMšM¨-¸Ó;ˆMæØ%Ð5¸ÈÈÐ8KÑKˆFàˆMäØ-Ø'Ø)×7Ñ7Ø&×1Ñ1Ø#2×#IÑ#Iñ
ð 	
r#   )rQ   rW   rm  rn  rl  r@  rp  )T)NNNN)r.   r/   r0   r1   rF   rv  r}  r   r   r3   r4   rÒ   r   r6   r9   rX   r7   r[   r\   s   @r!   ri  ri  [  s‡   ø† ÷ò,0òCð ð 59Ø,0Ø/3Ø&*ñ,
à˜u×0Ñ0Ñ1ð,
ð $ D™>ð,
ð ' t™nð	,
ð
 ˜d‘^ð,
ð 
ˆuÐ&Ð&Ñ	'ô,
ó ö,
r#   ri  z¦
    Dinat Model transformer with an image classification head on top (a linear layer on top of the final hidden state
    of the [CLS] token) e.g. for ImageNet.
    c                   ó²   ^ • \ rS rSrU 4S jr\     SS\\R                     S\\R                     S\\
   S\\
   S\\
   S\\\4   4S	 jj5       rS
rU =r$ )ÚDinatForImageClassificationi®  c                 ó^  >• [         TU ]  U5        [        U S/5        UR                  U l        [	        U5      U l        UR                  S:”  a5  [        R                  " U R
                  R                  UR                  5      O[        R                  " 5       U l
        U R                  5         g )Nrk  r   )rE   rF   r   Ú
num_labelsri  rY  r   r¯   rl  r  Ú
classifierrq  rO   s     €r!   rF   Ú$DinatForImageClassification.__init__µ  s„   ø€ Ü‰Ñ˜Ô ä˜$  
Ô+à ×+Ñ+ˆŒÜ Ó'ˆŒ
ð FL×EVÑEVÐYZÓEZŒBIŠId—j‘j×-Ñ-¨v×/@Ñ/@ÔAÔ`b×`kÒ`kÓ`mð 	Œð
 	‰Õr#   rT   Úlabelsr¸   rI  rK  rU   c                 ó<  • Ub  UOU R                   R                  nU R                  UUUUS9nUS   nU R                  U5      nSn	UGbŽ  U R                   R                  c‘  U R
                  S:X  a  SU R                   l        OoU R
                  S:”  aN  UR                  [        R                  :X  d  UR                  [        R                  :X  a  SU R                   l        OSU R                   l        U R                   R                  S:X  aI  [        5       n
U R
                  S:X  a&  U
" UR                  5       UR                  5       5      n	OŒU
" X‚5      n	OƒU R                   R                  S:X  a=  [        5       n
U
" UR                  SU R
                  5      UR                  S5      5      n	O,U R                   R                  S:X  a  [        5       n
U
" X‚5      n	U(       d  U4USS -   nU	b  U	4U-   $ U$ [        U	UUR                   UR"                  UR$                  S	9$ )
ab  
labels (`torch.LongTensor` of shape `(batch_size,)`, *optional*):
    Labels for computing the image classification/regression loss. Indices should be in `[0, ...,
    config.num_labels - 1]`. If `config.num_labels == 1` a regression loss is computed (Mean-Square loss), If
    `config.num_labels > 1` a classification loss is computed (Cross-Entropy).
Nr€  r   Ú
regressionÚsingle_label_classificationÚmulti_label_classificationrº   ra   )r?   r@   r*   r+   r,   )rQ   r  rY  rŒ  Úproblem_typer‹  rŠ   r3   Úlongrƒ   r	   Úsqueezer   r½   r   r=   r*   r+   r,   )rP   rT   rŽ  r¸   rI  rK  rÎ   r†  r@   r?   Úloss_fctr’   s               r!   rX   Ú#DinatForImageClassification.forwardÅ  sÐ  € ð &1Ñ%<‘kÀ$Ç+Á+×B]ÑB]ˆà—*‘*ØØ/Ø!5Ø#ð	 ð 
ˆð   ™
ˆà—‘ Ó/ˆàˆØÒØ{‰{×'Ñ'Ñ/Ø—?‘? aÓ'Ø/;D—K‘KÕ,Ø—_‘_ qÓ(¨f¯l©l¼e¿j¹jÓ.HÈFÏLÉLÔ\a×\eÑ\eÓLeØ/LD—K‘KÕ,à/KD—K‘KÔ,à{‰{×'Ñ'¨<Ó7Ü"›9Ø—?‘? aÓ'Ù# F§N¡NÓ$4°f·n±nÓ6FÓG‘Dá# FÓ3‘DØ—‘×)Ñ)Ð-JÓJÜ+Ó-Ù §¡¨B°·±Ó @À&Ç+Á+ÈbÃ/ÓR‘Ø—‘×)Ñ)Ð-IÓIÜ,Ó.Ù Ó/æØY ¨¨ Ñ,ˆFØ)-Ñ)9TG˜fÑ$ÐE¸vÐEä)ØØØ!×/Ñ/Ø×)Ñ)Ø#*×#AÑ#Añ
ð 	
r#   )rŒ  rY  r‹  )NNNNN)r.   r/   r0   r1   rF   r   r   r3   r4   Ú
LongTensorrÒ   r   r6   r=   rX   r7   r[   r\   s   @r!   r‰  r‰  ®  s”   ø† õð  ð 59Ø-1Ø,0Ø/3Ø&*ñ<
à˜u×0Ñ0Ñ1ð<
ð ˜×)Ñ)Ñ*ð<
ð $ D™>ð	<
ð
 ' t™nð<
ð ˜d‘^ð<
ð 
ˆuÐ0Ð0Ñ	1ô<
ó ö<
r#   r‰  zL
    NAT backbone, to be used with frameworks like DETR and MaskFormer.
    c                   ó†   ^ • \ rS rSrU 4S jrS r\   SS\R                  S\	\
   S\	\
   S\	\
   S\4
S	 jj5       rS
rU =r$ )ÚDinatBackbonei  c           	      ó6  >• [         TU ]  U5        [         TU ]	  U5        [        U S/5        [	        U5      U l        [        U5      U l        UR                  /[        [        UR                  5      5       Vs/ sH  n[        UR                  SU-  -  5      PM      sn-   U l        0 n[        U R                  U R                   5       H  u  pE["        R$                  " U5      X4'   M     ["        R&                  " U5      U l        U R+                  5         g s  snf )Nrk  ra   )rE   rF   Ú_init_backboner   rB   rW   r<  rm  rJ   r-  rå   r?  rƒ   rl  ÚzipÚ_out_featuresr   r   rI   Ú
ModuleDictÚhidden_states_normsrq  )rP   rQ   r3  r   Ústageri   rR   s         €r!   rF   ÚDinatBackbone.__init__  sí   ø€ Ü‰Ñ˜Ô Ü‰Ñ˜vÔ&ä˜$  
Ô+ä)¨&Ó1ˆŒÜ# FÓ+ˆŒØ#×-Ñ-Ð.ÔX]Ô^aÐbh×boÑboÓ^pÔXqÓ1rÑXqÐST´#°f×6FÑ6FÈÈAÉÑ6MÖ2NÑXqÑ1rÑrˆÔð !ÐÜ#& t×'9Ñ'9¸4¿=¹=Ö#IÑˆEÜ)+¯ª°lÓ)CÐÓ&ñ $Jä#%§=¢=Ð1DÓ#EˆÔ ð 	‰Õùò 2ss   Á9$Dc                 ó.   • U R                   R                  $ r   ru  rž   s    r!   rv  Ú"DinatBackbone.get_input_embeddings  rx  r#   rT   rI  r¸   rK  rU   c                 ó$  • Ub  UOU R                   R                  nUb  UOU R                   R                  nUb  UOU R                   R                  nU R	                  U5      nU R                  UUSSSS9nUR                  nSn[        U R                  U5       Hª  u  pšXR                  ;   d  M  U
R                  u  p¼pÞU
R                  SSSS5      R                  5       n
U
R                  X½U-  U5      n
U R                  U	   " U
5      n
U
R                  X½Xì5      n
U
R                  SSSS5      R                  5       n
XŠ4-  nM¬     U(       d  U4nU(       a  XöR                  4-  nU$ [!        UU(       a  UR                  OSUR"                  S	9$ )
aŸ  
Examples:

```python
>>> from transformers import AutoImageProcessor, AutoBackbone
>>> import torch
>>> from PIL import Image
>>> import requests

>>> url = "http://images.cocodataset.org/val2017/000000039769.jpg"
>>> image = Image.open(requests.get(url, stream=True).raw)

>>> processor = AutoImageProcessor.from_pretrained("shi-labs/nat-mini-in1k-224")
>>> model = AutoBackbone.from_pretrained(
...     "shi-labs/nat-mini-in1k-224", out_features=["stage1", "stage2", "stage3", "stage4"]
... )

>>> inputs = processor(image, return_tensors="pt")

>>> outputs = model(**inputs)

>>> feature_maps = outputs.feature_maps
>>> list(feature_maps[-1].shape)
[1, 512, 7, 7]
```NT)r¸   rI  rJ  rK  r-   r   ra   r
   r   )Úfeature_mapsr*   r+   )rQ   r  rI  r¸   rW   rm  r,   r  Ústage_namesÚout_featuresrq   rr   rÃ   r½   r   r*   r   r+   )rP   rT   rI  r¸   rK  rƒ  rÎ   r*   r¦  r¡  Úhidden_staterÅ   ri   rt   ru   r’   s                   r!   rX   ÚDinatBackbone.forward!  s  € ðB &1Ñ%<‘kÀ$Ç+Á+×B]ÑB]ˆà$8Ñ$DÑ È$Ï+É+×JjÑJjð 	ð 2CÑ1NÑ-ÐTX×T_ÑT_×TqÑTqÐàŸ?™?¨<Ó8Ðà—,‘,ØØ/Ø!%Ø59Øð ð 
ˆð  ×6Ñ6ˆàˆÜ#& t×'7Ñ'7¸Ö#GÑˆEØ×)Ñ)Õ)Ø:F×:LÑ:LÑ7
¨&Ø+×3Ñ3°A°q¸!¸QÓ?×JÑJÓLØ+×0Ñ0°Àe¹^È\ÓZØ#×7Ñ7¸Ò>¸|ÓLØ+×0Ñ0°ÀUÓYØ+×3Ñ3°A°q¸!¸QÓ?×JÑJÓLØ Ñ/’ñ $Hö Ø"_ˆFÞ#Ø×0Ñ0Ð2Ñ2ØˆMäØ%Þ3G˜'×/Ò/ÈTØ×)Ñ)ñ
ð 	
r#   )rW   rm  r   rl  )NNN)r.   r/   r0   r1   rF   rv  r   r3   rZ   r   rÒ   r   rX   r7   r[   r\   s   @r!   rš  rš    ss   ø† õò&0ð ð 04Ø,0Ø&*ñG
à—l‘lðG
ð ' t™nðG
ð $ D™>ð	G
ð
 ˜d‘^ðG
ð 
ôG
ó öG
r#   rš  )r‰  ri  rX  rš  )r‰   F)Ar2   r¿   Údataclassesr   Útypingr   r   r3   Útorch.utils.checkpointr   Útorch.nnr   r   r	   Úactivationsr   Úmodeling_outputsr   Úmodeling_utilsr   Úpytorch_utilsr   r   Úutilsr   r   r   r   r   r   Úutils.backbone_utilsr   Úconfiguration_dinatr   Únatten.functionalr   r   Ú
get_loggerr.   Úloggerr'   r9   r=   r„   rB   rG   rx   rZ   r¡   rÒ   r“   r•   r¤   rÔ   rß   rñ   rü   r  r*  r<  rX  ri  r‰  rš  Ú__all__r-   r#   r!   Ú<module>rº     s  ðñ @ã Ý !ß "ã Û Ý ß AÑ Aå !Ý .Ý -ß Q÷÷ õ 2Ý ,ñ ×Ñß;Ð;ò/ò/ð 
×	Ò	˜HÓ	%€ð Ùðñô
K˜ó Kóó ðKð  Ùðñô
K{ó Kóó ðKð& Ùðñô
K ó Kóó ðKô*b—i‘iô ô,!˜2Ÿ9™9ô !ôHr—y‘yô ñ0U—\‘\ð ¨eð ÀTð ÐV[×VbÑVbõ ô*%B—I‘Iô %ôC˜BŸI™Iô CôL
 "§)¡)ô 
ô! "§)¡)ô !ôH˜Ÿ	™	ô ô	"—)‘)ô 	ôD—‘ô DôN,—‘ô ,ô^C
2—9‘9ô C
ðL ô*˜?ó *ó ð*ð$ ôO
Ð%ó O
ó ðO
ñd ðñôN
Ð"6ó N
óðN
ñb ðñô
_
Ð(¨-ó _
óð
_
òD ar#   