ó
    <±hþK  ã            	       ó   • S r SSKJrJr  SSKrSSKrSSKJr  SSKJrJ	r	J
r
  SSKJr  SSKJrJrJrJr  SS	KJr  SS
KJrJr  SSKJr  SSKJr  \R6                  " \5      rS+S\R<                  S\S\ S\R<                  4S jjr! " S S\RD                  5      r# " S S\RD                  5      r$ " S S\RD                  5      r% " S S\RD                  5      r& " S S\RD                  5      r' " S S\RD                  5      r(\ " S S \5      5       r)\ " S! S"\)5      5       r*\" S#S$9 " S% S&\)5      5       r+\" S'S$9 " S( S)\)\5      5       r,/ S*Qr-g),zPyTorch ConvNext model.é    )ÚOptionalÚUnionN)Únn)ÚBCEWithLogitsLossÚCrossEntropyLossÚMSELossé   )ÚACT2FN)ÚBackboneOutputÚBaseModelOutputWithNoAttentionÚ(BaseModelOutputWithPoolingAndNoAttentionÚ$ImageClassifierOutputWithNoAttention)ÚPreTrainedModel)Úauto_docstringÚlogging)ÚBackboneMixiné   )ÚConvNextConfigÚinputÚ	drop_probÚtrainingÚreturnc                 ó  • US:X  d  U(       d  U $ SU-
  nU R                   S   4SU R                  S-
  -  -   nU[        R                  " X@R                  U R
                  S9-   nUR                  5         U R                  U5      U-  nU$ )a*  
Drop paths (Stochastic Depth) per sample (when applied in main path of residual blocks).

Comment by Ross Wightman: This is the same as the DropConnect impl I created for EfficientNet, etc networks,
however, the original name is misleading as 'Drop Connect' is a different form of dropout in a separate paper...
See discussion: https://github.com/tensorflow/tpu/issues/494#issuecomment-532968956 ... I've opted for changing the
layer and argument names to 'drop path' rather than mix DropConnect as a layer name and use 'survival rate' as the
argument.
ç        r   r   )r   )ÚdtypeÚdevice)ÚshapeÚndimÚtorchÚrandr   r   Úfloor_Údiv)r   r   r   Ú	keep_probr   Úrandom_tensorÚoutputs          Úf/var/www/html/shao/venv/lib/python3.13/site-packages/transformers/models/convnext/modeling_convnext.pyÚ	drop_pathr'   )   s   € ð CÓžxØˆØI‘€IØ[‰[˜‰^Ð ¨¯
©
°Q©Ñ 7Ñ7€EØ¤§
¢
¨5¿¹ÈEÏLÉLÑ YÑY€MØ×ÑÔØY‰YyÓ! MÑ1€FØ€Mó    c                   óŠ   ^ • \ rS rSrSrSS\\   SS4U 4S jjjrS\R                  S\R                  4S jr
S\4S	 jrS
rU =r$ )ÚConvNextDropPathé>   zXDrop paths (Stochastic Depth) per sample (when applied in main path of residual blocks).Nr   r   c                 ó.   >• [         TU ]  5         Xl        g ©N)ÚsuperÚ__init__r   )Úselfr   Ú	__class__s     €r&   r/   ÚConvNextDropPath.__init__A   s   ø€ Ü‰ÑÔØ"r(   Úhidden_statesc                 óB   • [        XR                  U R                  5      $ r-   )r'   r   r   ©r0   r3   s     r&   ÚforwardÚConvNextDropPath.forwardE   s   € Ü˜¯©¸¿¹ÓFÐFr(   c                 ó    • SU R                    3$ )Nzp=©r   )r0   s    r&   Ú
extra_reprÚConvNextDropPath.extra_reprH   s   € ØD—N‘NÐ#Ð$Ð$r(   r9   r-   )Ú__name__Ú
__module__Ú__qualname__Ú__firstlineno__Ú__doc__r   Úfloatr/   r   ÚTensorr6   Ústrr:   Ú__static_attributes__Ú__classcell__©r1   s   @r&   r*   r*   >   sQ   ø† Ùbñ# (¨5¡/ð #¸T÷ #ð #ðG U§\¡\ð G°e·l±lô Gð%˜C÷ %ò %r(   r*   c                   ój   ^ • \ rS rSrSrSU 4S jjrS\R                  S\R                  4S jrSr	U =r
$ )	ÚConvNextLayerNorméL   a5  LayerNorm that supports two data formats: channels_last (default) or channels_first.
The ordering of the dimensions in the inputs. channels_last corresponds to inputs with shape (batch_size, height,
width, channels) while channels_first corresponds to inputs with shape (batch_size, channels, height, width).
c                 óV  >• [         TU ]  5         [        R                  " [        R
                  " U5      5      U l        [        R                  " [        R                  " U5      5      U l        X l	        X0l
        U R                  S;  a  [        SU R                   35      eU4U l        g )N)Úchannels_lastÚchannels_firstzUnsupported data format: )r.   r/   r   Ú	Parameterr   ÚonesÚweightÚzerosÚbiasÚepsÚdata_formatÚNotImplementedErrorÚnormalized_shape)r0   rU   rR   rS   r1   s       €r&   r/   ÚConvNextLayerNorm.__init__R   s   ø€ Ü‰ÑÔÜ—l’l¤5§:¢:Ð.>Ó#?Ó@ˆŒÜ—L’L¤§¢Ð-=Ó!>Ó?ˆŒ	ØŒØ&ÔØ×ÑÐ#FÓFÜ%Ð(AÀ$×BRÑBRÐASÐ&TÓUÐUØ!1Ð 3ˆÕr(   Úxr   c                 óP  • U R                   S:X  aV  [        R                  R                  R	                  XR
                  U R                  U R                  U R                  5      nU$ U R                   S:X  a¯  UR                  nUR                  5       nUR                  SSS9nX-
  R                  S5      R                  SSS9nX-
  [        R                  " X@R                  -   5      -  nUR                  US9nU R                  S S 2S S 4   U-  U R                  S S 2S S 4   -   nU$ )NrK   rL   r   T)Úkeepdimé   )r   )rS   r   r   Ú
functionalÚ
layer_normrU   rO   rQ   rR   r   rA   ÚmeanÚpowÚsqrtÚto)r0   rW   Úinput_dtypeÚuÚss        r&   r6   ÚConvNextLayerNorm.forward\   s  € Ø×Ñ˜Ó.Ü—‘×#Ñ#×.Ñ.¨q×2GÑ2GÈÏÉÐVZ×V_ÑV_Ðae×aiÑaiÓjˆAð ˆð ×ÑÐ!1Ó1ØŸ'™'ˆKØ—‘“	ˆAØ—‘q $Ð'ˆAØ‘—‘˜A“×#Ñ# A¨tÐ#Ð4ˆAØ‘œ%Ÿ*š* Q¯©¡\Ó2Ñ2ˆAØ—‘˜;Ð'ˆAØ—‘šA˜t T˜MÑ*¨QÑ.°·±º1¸dÀD¸=Ñ1IÑIˆAØˆr(   )rQ   rS   rR   rU   rO   )çíµ ÷Æ°>rK   )r<   r=   r>   r?   r@   r/   r   rB   r6   rD   rE   rF   s   @r&   rH   rH   L   s-   ø† ñ÷
4ð˜Ÿ™ð ¨%¯,©,÷ ò r(   rH   c                   óf   ^ • \ rS rSrSrU 4S jrS\R                  S\R                  4S jr	Sr
U =r$ )ÚConvNextEmbeddingséj   zThis class is comparable to (and inspired by) the SwinEmbeddings class
found in src/transformers/models/swin/modeling_swin.py.
c                 ó  >• [         TU ]  5         [        R                  " UR                  UR
                  S   UR                  UR                  S9U l        [        UR
                  S   SSS9U l	        UR                  U l        g )Nr   ©Úkernel_sizeÚstridere   rL   ©rR   rS   )
r.   r/   r   ÚConv2dÚnum_channelsÚhidden_sizesÚ
patch_sizeÚpatch_embeddingsrH   Ú	layernorm©r0   Úconfigr1   s     €r&   r/   ÚConvNextEmbeddings.__init__o   sr   ø€ Ü‰ÑÔÜ "§	¢	Ø×Ñ ×!4Ñ!4°QÑ!7ÀV×EVÑEVÐ_e×_pÑ_pñ!
ˆÔô +¨6×+>Ñ+>¸qÑ+AÀtÐYiÑjˆŒØ"×/Ñ/ˆÕr(   Úpixel_valuesr   c                 óœ   • UR                   S   nX R                  :w  a  [        S5      eU R                  U5      nU R	                  U5      nU$ )Nr   zeMake sure that the channel dimension of the pixel values match with the one set in the configuration.)r   ro   Ú
ValueErrorrr   rs   )r0   rw   ro   Ú
embeddingss       r&   r6   ÚConvNextEmbeddings.forwardw   sT   € Ø#×)Ñ)¨!Ñ,ˆØ×,Ñ,Ó,ÜØwóð ð ×*Ñ*¨<Ó8ˆ
Ø—^‘^ JÓ/ˆ
ØÐr(   )rs   ro   rr   ©r<   r=   r>   r?   r@   r/   r   ÚFloatTensorrB   r6   rD   rE   rF   s   @r&   rg   rg   j   s/   ø† ñõ0ð E×$5Ñ$5ð ¸%¿,¹,÷ ò r(   rg   c                   ój   ^ • \ rS rSrSrSU 4S jjrS\R                  S\R                  4S jr	Sr
U =r$ )	ÚConvNextLayeré‚   a  This corresponds to the `Block` class in the original implementation.

There are two equivalent implementations: [DwConv, LayerNorm (channels_first), Conv, GELU,1x1 Conv]; all in (N, C,
H, W) (2) [DwConv, Permute to (N, H, W, C), LayerNorm (channels_last), Linear, GELU, Linear]; Permute back

The authors used (2) as they find it slightly faster in PyTorch.

Args:
    config ([`ConvNextConfig`]): Model configuration class.
    dim (`int`): Number of input channels.
    drop_path (`float`): Stochastic depth rate. Default: 0.0.
c                 ó   >• [         TU ]  5         [        R                  " X"SSUS9U l        [        USS9U l        [        R                  " USU-  5      U l        [        UR                     U l        [        R                  " SU-  U5      U l        UR                  S:”  a6  [        R                  " UR                  [        R                   " U5      -  SS	9OS U l        US
:”  a  [%        U5      U l        g [        R&                  " 5       U l        g )Né   r	   )rk   ÚpaddingÚgroupsre   ©rR   é   r   T)Úrequires_gradr   )r.   r/   r   rn   ÚdwconvrH   rs   ÚLinearÚpwconv1r
   Ú
hidden_actÚactÚpwconv2Úlayer_scale_init_valuerM   r   rN   Úlayer_scale_parameterr*   ÚIdentityr'   )r0   ru   Údimr'   r1   s       €r&   r/   ÚConvNextLayer.__init__   sÑ   ø€ Ü‰ÑÔÜ—i’i °aÀÈ3ÑOˆŒÜ*¨3°DÑ9ˆŒÜ—y’y  a¨#¡gÓ.ˆŒÜ˜&×+Ñ+Ñ,ˆŒÜ—y’y  S¡¨#Ó.ˆŒð ×,Ñ,¨qÓ0ô LŠL˜×6Ñ6¼¿ºÀC»ÑHÐX\Ò]àð 	Ô"ð
 9BÀC»Ô)¨)Ó4ˆÌRÏ[Ê[Ë]ˆr(   r3   r   c                 ób  • UnU R                  U5      nUR                  SSSS5      nU R                  U5      nU R                  U5      nU R	                  U5      nU R                  U5      nU R                  b  U R                  U-  nUR                  SSSS5      nX R                  U5      -   nU$ )Nr   rZ   r	   r   )rˆ   Úpermuters   rŠ   rŒ   r   r   r'   )r0   r3   r   rW   s       r&   r6   ÚConvNextLayer.forwardž   s¤   € ØˆØK‰K˜Ó&ˆØI‰Ia˜˜A˜qÓ!ˆØN‰N˜1ÓˆØL‰L˜‹OˆØH‰HQ‹KˆØL‰L˜‹OˆØ×%Ñ%Ñ1Ø×*Ñ*¨QÑ.ˆAØI‰Ia˜˜A˜qÓ!ˆà—N‘N 1Ó%Ñ%ˆØˆr(   )rŒ   r'   rˆ   r   rs   rŠ   r   )r   r|   rF   s   @r&   r   r   ‚   s0   ø† ñ÷[ð U×%6Ñ%6ð ¸5¿<¹<÷ ò r(   r   c                   ój   ^ • \ rS rSrSrSU 4S jjrS\R                  S\R                  4S jr	Sr
U =r$ )	ÚConvNextStageé®   a}  ConvNeXT stage, consisting of an optional downsampling layer + multiple residual blocks.

Args:
    config ([`ConvNextConfig`]): Model configuration class.
    in_channels (`int`): Number of input channels.
    out_channels (`int`): Number of output channels.
    depth (`int`): Number of residual blocks.
    drop_path_rates(`list[float]`): Stochastic depth rates for each layer.
c                 ó|  >• [         T	U ]  5         X#:w  d  US:”  a9  [        R                  " [	        USSS9[        R
                  " X#XES95      U l        O[        R                  " 5       U l        U=(       d    S/U-  n[        R                  " [        U5       Vs/ sH  n[        XXx   S9PM     sn6 U l
        g s  snf )Nr   re   rL   rm   rj   r   )r‘   r'   )r.   r/   r   Ú
SequentialrH   rn   Údownsampling_layerr   Úranger   Úlayers)
r0   ru   Úin_channelsÚout_channelsrk   rl   ÚdepthÚdrop_path_ratesÚjr1   s
            €r&   r/   ÚConvNextStage.__init__¹   sž   ø€ Ü‰ÑÔàÓ&¨&°1«*Ü&(§m¢mÜ! +°4ÐEUÑVÜ—	’	˜+ÀÑ\ó'ˆDÕ#ô
 ')§k¢k£mˆDÔ#Ø)×:¨c¨U°U©]ˆÜ—m’mÜ]bÐchÔ]iÓjÑ]iÐXYŒm˜FÀÑ@RÔSÑ]iÑjð
ˆùÚjs   ÂB9r3   r   c                 óJ   • U R                  U5      nU R                  U5      nU$ r-   ©r›   r   r5   s     r&   r6   ÚConvNextStage.forwardÈ   s&   € Ø×/Ñ/°Ó>ˆØŸ™ MÓ2ˆØÐr(   r¥   )rZ   rZ   rZ   Nr|   rF   s   @r&   r—   r—   ®   s/   ø† ñ÷
ð U×%6Ñ%6ð ¸5¿<¹<÷ ò r(   r—   c                   ót   ^ • \ rS rSrU 4S jr  S	S\R                  S\\   S\\   S\	\
\4   4S jjrSrU =r$ )
ÚConvNextEncoderéÎ   c           
      ó,  >• [         TU ]  5         [        R                  " 5       U l        [
        R                  " SUR                  [        UR                  5      SS9R                  UR                  5       Vs/ sH  nUR                  5       PM     nnUR                  S   n[        UR                  5       HT  nUR                  U   n[        UUUUS:”  a  SOSUR                  U   X5   S9nU R                  R!                  U5        UnMV     g s  snf )Nr   Úcpu)r   rZ   r   )rž   rŸ   rl   r    r¡   )r.   r/   r   Ú
ModuleListÚstagesr   ÚlinspaceÚdrop_path_rateÚsumÚdepthsÚsplitÚtolistrp   rœ   Ú
num_stagesr—   Úappend)	r0   ru   rW   r¡   Úprev_chsÚiÚout_chsÚstager1   s	           €r&   r/   ÚConvNextEncoder.__init__Ï   sù   ø€ Ü‰ÑÔÜ—m’m“oˆŒô —^’^ A v×'<Ñ'<¼cÀ&Ç-Á-Ó>PÐY^Ñ_×eÑeÐfl×fsÑfsÔtó
átð H‰HŽJÙtð 	ð 
ð ×&Ñ& qÑ)ˆÜv×(Ñ(Ö)ˆAØ×)Ñ)¨!Ñ,ˆGÜ!ØØ$Ø$Ø ›E‘q qØ—m‘m AÑ&Ø /Ñ 2ñˆEð K‰K×Ñ˜uÔ%ØŠHò *ùò
s   Á9Dr3   Úoutput_hidden_statesÚreturn_dictr   c                 óÜ   • U(       a  SOS n[        U R                  5       H  u  pVU(       a  XA4-   nU" U5      nM     U(       a  XA4-   nU(       d  [        S X4 5       5      $ [        UUS9$ )N© c              3   ó,   #   • U H  oc  M  Uv •  M     g 7fr-   r¾   )Ú.0Úvs     r&   Ú	<genexpr>Ú*ConvNextEncoder.forward.<locals>.<genexpr>ö   s   é € ÐXÑ$F˜qŸ™Ò$Fùs   ‚‹	)Úlast_hidden_stater3   )Ú	enumerater­   Útupler   )r0   r3   r»   r¼   Úall_hidden_statesr·   Úlayer_modules          r&   r6   ÚConvNextEncoder.forwardä   sw   € ö #7™B¸DÐä(¨¯©Ö5‰OˆAÞ#Ø$5Ð8HÑ$HÐ!á(¨Ó7ŠMñ	  6ö  Ø 1Ð4DÑ DÐæÜÑX ]Ñ$FÓXÓXÐXä-Ø+Ø+ñ
ð 	
r(   )r­   )FT)r<   r=   r>   r?   r/   r   r}   r   Úboolr   rÆ   r   r6   rD   rE   rF   s   @r&   r¨   r¨   Î   sY   ø† õð0 05Ø&*ñ	
à×(Ñ(ð
ð ' t™nð
ð ˜d‘^ð	
ð
 
ˆuÐ4Ð4Ñ	5÷
ó 
r(   r¨   c                   ó4   • \ rS rSr% \\S'   SrSrS/rS r	Sr
g)	ÚConvNextPreTrainedModeléþ   ru   Úconvnextrw   r   c                 óÐ  • [        U[        R                  [        R                  45      (       ak  UR                  R
                  R                  SU R                  R                  S9  UR                  b%  UR                  R
                  R                  5         gg[        U[        R                  [        45      (       aJ  UR                  R
                  R                  5         UR                  R
                  R                  S5        g[        U[        5      (       aH  UR                  b:  UR                  R
                  R                  U R                  R                   5        ggg)zInitialize the weightsr   )r]   ÚstdNg      ð?)Ú
isinstancer   r‰   rn   rO   ÚdataÚnormal_ru   Úinitializer_rangerQ   Úzero_Ú	LayerNormrH   Úfill_r   r   rŽ   )r0   Úmodules     r&   Ú_init_weightsÚ%ConvNextPreTrainedModel._init_weights  sö   € äfœrŸy™y¬"¯)©)Ð4×5Ñ5ð M‰M×Ñ×&Ñ&¨C°T·[±[×5RÑ5RÐ&ÑSØ{‰{Ñ&Ø—‘× Ñ ×&Ñ&Õ(ð 'ä˜¤§¡Ô/@Ð A×BÑBØK‰K×Ñ×"Ñ"Ô$ØM‰M×Ñ×$Ñ$ SÕ)Ü˜¤×.Ñ.Ø×+Ñ+Ñ7Ø×,Ñ,×1Ñ1×7Ñ7¸¿¹×8ZÑ8ZÕ[ð 8ð /r(   r¾   N)r<   r=   r>   r?   r   Ú__annotations__Úbase_model_prefixÚmain_input_nameÚ_no_split_modulesrÙ   rD   r¾   r(   r&   rÌ   rÌ   þ   s"   ‡ àÓØ"ÐØ$€OØ(Ð)Ðõ\r(   rÌ   c                   ó†   ^ • \ rS rSrU 4S jr\   S	S\\R                     S\\	   S\\	   S\
\\4   4S jj5       rSrU =r$ )
ÚConvNextModeli  c                 óò   >• [         TU ]  U5        Xl        [        U5      U l        [        U5      U l        [        R                  " UR                  S   UR                  S9U l        U R                  5         g )Néÿÿÿÿr…   )r.   r/   ru   rg   rz   r¨   Úencoderr   rÖ   rp   Úlayer_norm_epsrs   Ú	post_initrt   s     €r&   r/   ÚConvNextModel.__init__  s^   ø€ Ü‰Ñ˜Ô ØŒä,¨VÓ4ˆŒÜ& vÓ.ˆŒô Ÿš f×&9Ñ&9¸"Ñ&=À6×CXÑCXÑYˆŒð 	‰Õr(   rw   r»   r¼   r   c                 óf  • Ub  UOU R                   R                  nUb  UOU R                   R                  nUc  [        S5      eU R	                  U5      nU R                  UUUS9nUS   nU R                  UR                  SS/5      5      nU(       d	  Xg4USS  -   $ [        UUUR                  S9$ )Nz You have to specify pixel_values©r»   r¼   r   éþÿÿÿrâ   r   )rÄ   Úpooler_outputr3   )
ru   r»   Úuse_return_dictry   rz   rã   rs   r]   r   r3   )r0   rw   r»   r¼   Úembedding_outputÚencoder_outputsrÄ   Úpooled_outputs           r&   r6   ÚConvNextModel.forward$  sÔ   € ð %9Ñ$DÑ È$Ï+É+×JjÑJjð 	ð &1Ñ%<‘kÀ$Ç+Á+×B]ÑB]ˆàÑÜÐ?Ó@Ð@àŸ?™?¨<Ó8ÐàŸ,™,ØØ!5Ø#ð 'ð 
ˆð ,¨AÑ.Ðð Ÿ™Ð'8×'=Ñ'=¸rÀ2¸hÓ'GÓHˆæØ%Ð5¸ÈÈÐ8KÑKÐKä7Ø/Ø'Ø)×7Ñ7ñ
ð 	
r(   )ru   rz   rã   rs   )NNN)r<   r=   r>   r?   r/   r   r   r   r}   rÊ   r   rÆ   r   r6   rD   rE   rF   s   @r&   rà   rà     sk   ø† õð ð 59Ø/3Ø&*ñ	"
à˜u×0Ñ0Ñ1ð"
ð ' t™nð"
ð ˜d‘^ð	"
ð
 
ˆuÐ>Ð>Ñ	?ô"
ó ö"
r(   rà   zˆ
    ConvNext Model with an image classification head on top (a linear layer on top of the pooled features), e.g. for
    ImageNet.
    )Úcustom_introc                   ó¦   ^ • \ rS rSrU 4S jr\    S
S\\R                     S\\R                     S\\
   S\\
   S\\\4   4
S jj5       rS	rU =r$ )ÚConvNextForImageClassificationiJ  c                 ó6  >• [         TU ]  U5        UR                  U l        [        U5      U l        UR                  S:”  a.  [
        R                  " UR                  S   UR                  5      O[
        R                  " 5       U l	        U R                  5         g )Nr   râ   )r.   r/   Ú
num_labelsrà   rÎ   r   r‰   rp   r   Ú
classifierrå   rt   s     €r&   r/   Ú'ConvNextForImageClassification.__init__Q  sy   ø€ Ü‰Ñ˜Ô à ×+Ñ+ˆŒÜ% fÓ-ˆŒð FL×EVÑEVÐYZÓEZŒBIŠIf×)Ñ)¨"Ñ-¨v×/@Ñ/@ÔAÔ`b×`kÒ`kÓ`mð 	Œð
 	‰Õr(   rw   Úlabelsr»   r¼   r   c                 ó2  • Ub  UOU R                   R                  nU R                  XUS9nU(       a  UR                  OUS   nU R	                  U5      nSnUGbŽ  U R                   R
                  c‘  U R                  S:X  a  SU R                   l        OoU R                  S:”  aN  UR                  [        R                  :X  d  UR                  [        R                  :X  a  SU R                   l        OSU R                   l        U R                   R
                  S:X  aI  [        5       n	U R                  S:X  a&  U	" UR                  5       UR                  5       5      nOŒU	" Xr5      nOƒU R                   R
                  S:X  a=  [        5       n	U	" UR                  SU R                  5      UR                  S5      5      nO,U R                   R
                  S:X  a  [        5       n	U	" Xr5      nU(       d  U4USS -   n
Ub  U4U
-   $ U
$ [!        UUUR"                  S	9$ )
ab  
labels (`torch.LongTensor` of shape `(batch_size,)`, *optional*):
    Labels for computing the image classification/regression loss. Indices should be in `[0, ...,
    config.num_labels - 1]`. If `config.num_labels == 1` a regression loss is computed (Mean-Square loss), If
    `config.num_labels > 1` a classification loss is computed (Cross-Entropy).
Nrè   r   Ú
regressionÚsingle_label_classificationÚmulti_label_classificationrâ   rZ   )ÚlossÚlogitsr3   )ru   rë   rÎ   rê   rõ   Úproblem_typerô   r   r   ÚlongÚintr   Úsqueezer   Úviewr   r   r3   )r0   rw   r÷   r»   r¼   Úoutputsrî   rý   rü   Úloss_fctr%   s              r&   r6   Ú&ConvNextForImageClassification.forward_  sº  € ð &1Ñ%<‘kÀ$Ç+Á+×B]ÑB]ˆà—-‘- Ðep-Ðqˆæ1<˜×-Ò-À'È!Á*ˆà—‘ Ó/ˆàˆØÒØ{‰{×'Ñ'Ñ/Ø—?‘? aÓ'Ø/;D—K‘KÕ,Ø—_‘_ qÓ(¨f¯l©l¼e¿j¹jÓ.HÈFÏLÉLÔ\a×\eÑ\eÓLeØ/LD—K‘KÕ,à/KD—K‘KÔ,à{‰{×'Ñ'¨<Ó7Ü"›9Ø—?‘? aÓ'Ù# F§N¡NÓ$4°f·n±nÓ6FÓG‘Dá# FÓ3‘DØ—‘×)Ñ)Ð-JÓJÜ+Ó-Ù §¡¨B°·±Ó @À&Ç+Á+ÈbÃ/ÓR‘Ø—‘×)Ñ)Ð-IÓIÜ,Ó.Ù Ó/ÞØY ¨¨ Ñ,ˆFØ)-Ñ)9TG˜fÑ$ÐE¸vÐEä3ØØØ!×/Ñ/ñ
ð 	
r(   )rõ   rÎ   rô   )NNNN)r<   r=   r>   r?   r/   r   r   r   r}   Ú
LongTensorrÊ   r   rÆ   r   r6   rD   rE   rF   s   @r&   rò   rò   J  sƒ   ø† õð ð 59Ø-1Ø/3Ø&*ñ3
à˜u×0Ñ0Ñ1ð3
ð ˜×)Ñ)Ñ*ð3
ð ' t™nð	3
ð
 ˜d‘^ð3
ð 
ˆuÐ:Ð:Ñ	;ô3
ó ö3
r(   rò   zQ
    ConvNeXt backbone, to be used with frameworks like DETR and MaskFormer.
    c            
       ót   ^ • \ rS rSrU 4S jr\  S	S\R                  S\\	   S\\	   S\
4S jj5       rSrU =r$ )
ÚConvNextBackbonei–  c                 óŠ  >• [         TU ]  U5        [         TU ]	  U5        [        U5      U l        [        U5      U l        UR                  S   /UR                  -   U l        0 n[        U R                  U R                  5       H  u  p4[        USS9X#'   M     [        R                  " U5      U l        U R!                  5         g )Nr   rL   )rS   )r.   r/   Ú_init_backbonerg   rz   r¨   rã   rp   Únum_featuresÚzipÚ_out_featuresÚchannelsrH   r   Ú
ModuleDictÚhidden_states_normsrå   )r0   ru   r  r¹   ro   r1   s        €r&   r/   ÚConvNextBackbone.__init__œ  s¬   ø€ Ü‰Ñ˜Ô Ü‰Ñ˜vÔ&ä,¨VÓ4ˆŒÜ& vÓ.ˆŒØ#×0Ñ0°Ñ3Ð4°v×7JÑ7JÑJˆÔð !ÐÜ#& t×'9Ñ'9¸4¿=¹=Ö#IÑˆEÜ):¸<ÐUeÑ)fÐÓ&ñ $Jä#%§=¢=Ð1DÓ#EˆÔ ð 	‰Õr(   rw   r»   r¼   r   c                 óØ  • Ub  UOU R                   R                  nUb  UOU R                   R                  nU R                  U5      nU R	                  USUS9nU(       a  UR
                  OUS   nSn[        U R                  U5       H0  u  p‰X€R                  ;   d  M  U R                  U   " U	5      n	Xy4-  nM2     U(       d  U4n
U(       a  X¦4-  n
U
$ [        UU(       a  USS9$ SSS9$ )a   
Examples:

```python
>>> from transformers import AutoImageProcessor, AutoBackbone
>>> import torch
>>> from PIL import Image
>>> import requests

>>> url = "http://images.cocodataset.org/val2017/000000039769.jpg"
>>> image = Image.open(requests.get(url, stream=True).raw)

>>> processor = AutoImageProcessor.from_pretrained("facebook/convnext-tiny-224")
>>> model = AutoBackbone.from_pretrained("facebook/convnext-tiny-224")

>>> inputs = processor(image, return_tensors="pt")
>>> outputs = model(**inputs)
```NTrè   r   r¾   )Úfeature_mapsr3   Ú
attentions)ru   rë   r»   rz   rã   r3   r  Ústage_namesÚout_featuresr  r   )r0   rw   r»   r¼   rì   r  r3   r  r¹   Úhidden_stater%   s              r&   r6   ÚConvNextBackbone.forward­  s  € ð2 &1Ñ%<‘kÀ$Ç+Á+×B]ÑB]ˆà$8Ñ$DÑ È$Ï+É+×JjÑJjð 	ð  Ÿ?™?¨<Ó8Ðà—,‘,ØØ!%Ø#ð ð 
ˆö 2=˜×-Ò-À'È!Á*ˆàˆÜ#& t×'7Ñ'7¸Ö#GÑˆEØ×)Ñ)Õ)Ø#×7Ñ7¸Ò>¸|ÓLØ Ñ/’ñ $Hö
 Ø"_ˆFÞ#ØÐ*Ñ*ØˆMäØ%Þ+?˜-Øñ
ð 	
àEIØñ
ð 	
r(   )rz   rã   r  r  )NN)r<   r=   r>   r?   r/   r   r   rB   r   rÊ   r   r6   rD   rE   rF   s   @r&   r  r  –  sV   ø† õð" ð 04Ø&*ñ	7
à—l‘lð7
ð ' t™nð7
ð ˜d‘^ð	7
ð
 
ô7
ó ö7
r(   r  )rò   rà   rÌ   r  )r   F).r@   Útypingr   r   r   Útorch.utils.checkpointr   Útorch.nnr   r   r   Úactivationsr
   Úmodeling_outputsr   r   r   r   Úmodeling_utilsr   Úutilsr   r   Úutils.backbone_utilsr   Úconfiguration_convnextr   Ú
get_loggerr<   ÚloggerrB   rA   rÊ   r'   ÚModuler*   rH   rg   r   r—   r¨   rÌ   rà   rò   r  Ú__all__r¾   r(   r&   Ú<module>r&     sq  ðñ ç "ã Û Ý ß AÑ Aå !÷ó õ .ß ,Ý 1Ý 2ð 
×	Ò	˜HÓ	%€ñU—\‘\ð ¨eð ÀTð ÐV[×VbÑVbõ ô*%r—y‘yô %ô˜Ÿ	™	ô ô<˜Ÿ™ô ô0)B—I‘Iô )ôXB—I‘Iô ô@-
b—i‘iô -
ð` ô\˜oó \ó ð\ð, ô1
Ð+ó 1
ó ð1
ñh ðñôC
Ð%<ó C
óðC
ñL ðñô
J
Ð.°ó J
óð
J
òZ mr(   